在最近的一次突破中,谷歌与DeepMind共同发布了一篇关于他们最新的人工智能工具的开放获取论文,这些工具专门为医疗领域设计。谷歌的研究团队大胆推出了名为Med-Gemini的模型,这还只是个试验品呢,却已经在14个流行的行业基准测试中打破了常规,实力不容小觑。
别看其他大型语言模型在面对不确定的临床推理时显得力不从心,Med-Gemini却能提供更准确、可靠且细腻的结果。比如,在MedQA这个广受欢迎的基准测试中,它的准确率高达91.1%,简直让其他竞争对手,包括GPT-4都自愧不如。
这个模型系列不仅在医疗文本总结和编写转诊信方面超越了人类,就连临床医生也评价Med-Gemini-M 1.0的回答有一半是不输专家的水平。最引人注目的是,Med-Gemini在处理电子健康记录中的复杂查询任务上有着出色的表现,能够长距离处理大文本并整合搜索功能,有效减轻医护人员的认知负担,提升他们处理海量病人数据时的效率。

例如,在一次实际应用中,有患者上传了一张皮肤病变的照片询问诊断,Med-Gemini不仅向患者提出了一系列问题,还给出了可能的诊断结果和治疗方案。当一名皮肤科医生审查了这一互动后,对Med-Gemini给出的诊断和治疗建议大加赞赏,尤其是对于稀有疾病如结节性瘙痒症的精准诊断和全面的治疗方案表示印象深刻。
尽管如此,谷歌坦承,他们的模型在真正投入医疗领域使用前还需要更多的微调和专业化改进。同时,谷歌也在积极探索如何在模型开发过程中整合负责任的AI原则,确保未来的AI在公平、隐私、平等、透明度和责任感等方面都能达到标准。这场智能革命,才刚刚开始!