하버드 응급실 연구에서 AI가 의사들을 능가

2026. 5. 4.

OpenAI o1-preview가 하버드의 76건 실제 사례 연구에서 응급실 의사들보다 더 정확하게 진단했습니다 원시 EHR 텍스트가 어떻게 모델이 사례를 더 빠르고 더 정확하게 찾아내는 데 도움이 되었는지 확인해 보세요

하버드 연구에 따르면, OpenAI의 o1preview 모델은 76건의 실제 응급실 사례를 활용한 시험에서 응급실 근무의사 2명보다 환자를 더 정확하게 진단했습니다. 이 모델은 원시 전자 건강기록 텍스트만을 바탕으로 작동했으며, 환자 치료의 여러 단계에 걸쳐 성능이 평가되었습니다. 보고서에 따르면, AI는 초기 분류 사례의 67.1%에서 올바른 진단을 식별했으며, 이는 두 의사의 55.3%와 50.0%를 웃도는 수치였습니다. 독립적인 의사 검토자들은 어떤 진단이 모델에서 나온 것이고 어떤 것이 사람에게서 나온 것인지 구분할 수 없었습니다. 이러한 결과는 AI 도구가 임상 의사결정을 지원할 수 있다는 증가하는 증거를 더해주며, 특히 이미 더 많은 사람들이 건강 관련 질문에 챗봇을 사용하고 있는 상황에서 더욱 그렇습니다. 이 연구에는 또한 한 사례에서 모델이 치료하는 의사보다 심각한 상태를 더 일찍 경고하는 데 도움이 된 예시도 포함되었습니다.