“我们的症状诊断系统针对常见病典型症状的命中率已超过90%,已超过对标的梅奥医疗集团的症状诊断工具symptom checker10个百分点。”康夫子创始人兼CEO张超说。
他表示,这是因为传统的诊断学思维,大多使用人工编辑的知识库,知识库规模较小,在知识和信息更新上比较滞后,不能以自然语言处理,且采用决策树的结构,在诊断效果上很快就会达到瓶颈。而康夫子基于知识图谱推出的智能诊断系统在技术上会更有优势。
从技术原理上来说,康夫子智能诊断是经过3大步骤训练出来的。
知识抽取:让计算机阅读理解海量医疗文献,抽取针对某种知识总结出上万条书写规律。如针对”疾病<—>症状”的关系,文献中描述方式为:“(X疾病)的症状有(Y症状) ”,“(X疾病)临床表现为(Y症状)”,“(X疾病)容易引起(Y症状)等不适症状”等等。 “知识规律”自动发现技术和高性能抽取工具,正是康夫子的技术壁垒。
知识表示:包括知识向量化(即医学专业术语与大众语言的对应,比如“厌食”属于医学专业术语,对应的大众语言是“吃不下饭”)表示和知识关系概率化(一种疾病可能包括多种症状,一种症状也可能是多种疾病共同拥有的,二者的对应关系有一定概率)表示。
逻辑应用:当用户搜索某种症状后,是否还会有其他伴随症状?这就涉及到查询分析和人机交互,最终呈现搜索结果。
实际上,除了symptom checker,国内也有类似的产品,比如多美小壹和半个医生。从内测Demo来看,康夫子诊断表现形式和半个医生相似度很高。但除了症状,康夫子用户还可以输入辅助检查结果(如白细胞数、AFP、TSH等数千种化验指标)来获取更科学的诊断。张超表示,此Demo主要供B端用户调研使用,并不直接面向患者端。
康夫子微信服务号截图
目前,康夫子已经学习了近万本医学书籍、2000万篇医学论文,针对近1万多种疾病、数千种症状、化验指标、用药反应等知识构建了知识图谱。在7月中旬上线的康夫子1.0.1版本中,覆盖热门症状5000种,ICD10常见疾病4000种。
在后期,康夫子计划考虑患者群体特征(年龄、性别、孕妇、高血压等等)、患者病史、生活习惯等,让诊断变得更智能。不过,张超表示,智能诊断只是医疗大脑(医学知识图谱+推理逻辑)的一部分。康夫子想以这条线,把很多工作串起来。比如先诊断,再提供治疗建议、用药建议、预后管理等。
当前所有的智能诊断产品还普遍面临一个技术难题,即假设患者只患有一种病。然而,一个人很大可能会同时患多种疾病。针对此类问题,张超认为,将输入症状进行时间序列化,可以得到较好地解决。
值得一提的是,2C的智能诊断因为变现难的问题,似乎都最终会走上B2B2C之路。相较于多美小壹和半个医生,起步较晚的康夫子也少走了一些弯路。不过,在做智能诊断之前,康夫子是做食物的营养健康分析和食谱推荐的,其构建营养健康知识图谱还在天使医生、中粮数字等业务中得到了付费应用。他们认为老百姓在这块的痛点不强、依从性略差,于是转移了业务重心。
张超透露,康夫子智能诊断的B端目标客户分为三大类:搜索引擎类(借助大平台提供服务,同时共享流量)、智能硬件类(嵌入智能硬件,提升它们软能力)、以及医疗服务类(辅助全科或基层医生做医疗诊断)。
据了解,张超曾在新加坡国立大学从事人工智能方向的研究工作,后担任百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人,是知识图谱、实体建模方面专家;CTO张冲是前百度高级研发工程师,拥有丰富的架构、工程开发经验;CMO李志朋为前地坛医院主治医师,后担任卫计委处长一职,在20余年从业经历中积累了大量的临床经验和医疗资源。