微软在必应搜索历史中找到癌症诊断线索

杰西卡·霍尔(Jessica Hall)

如果您感到不寒而栗,想知道是否有人在某处可以看到您的搜索历史…现在就知道了。 是。 他们有。 但是他们正在尽力而为。 微软科学家展示了一个演示,该演示通过分析来自其Bing搜索引擎的大量匿名查询,科学家甚至可以在诊断出该疾病之前,就能够识别遭受胰腺癌困扰的互联网用户。

“我们问自己,’如果我们听到网上有人的耳语,它会提供有力的证据还是线索表明正在发生什么事情?’”合著者Eric Horvitz博士说。 霍维茨,同样来自微软的Ryen White博士和哥伦比亚大学的研究生约翰·帕帕里索斯(John Paparrizos)合作研究使用微软搜索引擎Bing进行的搜索,这表明有人被诊断出患有胰腺癌。 从出现查询提示诊断的查询开始,他们就及时向后退,在样本历史中寻找可能表明Bing用户正在出现症状的搜索词。

研究人员认为,那些早期搜索的模式可能是警告未来重大健康问题的危险信号。 研究人员在《肿瘤实践杂志》上报告说,他们可以识别5%至15%的胰腺癌病例,但他们的确诊率仅为100,000分之一。 这就像快速链球菌文化如何工作。 他们不会每次都感染链球菌,但是当他们报告阳性结果时,他们就可以确定它是链球菌,而不是其他东西。

霍维茨博士来自医学和计算机科学领域,他说,在与一位描述症状的朋友通电话后,他开始研究这一领域。 根据他们的谈话,霍维茨医生建议他的朋友去医疗。 实际上,他被诊断出患有胰腺癌,并在几个月后死亡。

尽管匿名数据意味着研究人员无法与数据所在的个人联系,但显然下一步是切实可行的,后勤的。 科学家们必须学习如何使用大数据,而又不会浪费大量的信息质量。 改进我们处理此类生物统计信息的方式可以实现一整套全新的廉价,以数据为基础的卫生服务。 霍维茨博士沉思说:“有一天可能有一个Cortana可以健康吗?”

这说得通。 您有多少次在线搜索症状,而不是花大量时间和精力去看医生? 如果我们可以隔离可靠的搜索模式,则此类数据可能是诊断性的金矿。 谷歌已经开始在这一浪潮中冲浪,但是他们对预测医学的尝试主要是如何不处理大数据的一个例子。 但是Google流感经常被高估(PDF)。 这个事实可以代表与接受医疗保健相比Google症状容易吗? 我们不一定知道在寻找流感症状的人与患有流感的人之间存在1:1的关系。 似乎更多地关注了这个问题,但答案仍然是。

另一方面,我们不只是问谁来保护数据吗? 似乎这里有明显的HIPAA含义。 任何这样的数据库都是黑帽和商业利益的诱人目标。 您可以通过点击进入TOS同意使用少数群体报告式的搜索历史识别功能吗?

霍维茨博士说:“我认为主流医学文献对这类研究和这类数据一直持抵触态度。” “我们希望这会激发很多有趣的对话。”接下来,他们将告诉我们,我们应该免费提供我们的浏览器历史记录-用于科学。

现在阅读:机器学习为对抗抗生素耐药性提供了希望

注意:本文最初发布在ExtremeTech.com上。