
AIネイティブなヘルスケア:1億件の診察、10~20時間の削減、数分での事前承認 — Janie Lee & Chai Asawa, Abridge
- Abridge(アブリッジ)は、医療現場における「会話」という最も重要でありながらこれまで十分に活用されてこなかったワークフローを、AIの力で根本から変革しようとしている...
- ホストのswyxとAlessio Fanelli、そしてRedpointのJacob Effronを交えたクロスオーバー対談は、単なるプロダクト紹介に留まらない。医療AI...
- [0:03] 臨床文書作成から臨床インテリジェンス層へ:Abridgeの三幕構成 Abridgeのプロダクト進化は、明確な三幕構成で語られる。第一幕は「時間の節約」だ。医...
自分では見つけにくい海外Podcastの話題に、日本語で気軽に触れたい人。
Latent Space: The AI Engineer Podcast / Latent.Space
Abridge(アブリッジ)は、医療現場における「会話」という最も重要でありながらこれまで十分に活用されてこなかったワークフローを、AIの力で根本から変革しようとしている。2018年の創業以来、臨床文書作成の自動化からスタートし、現在では医療システム全体の「臨床インテリジェンス層」としての地位を確立しつつある。同社のプロダクトは、医師と患者の会話をリアルタイムで傍受し、診療記録の自動作成、事前承認のリアルタイム支援、臨床判断のサポートなど、診療の前・中・後をシームレスにカバーする。その規模は驚異的で、2025年には250以上の大規模医療システムにおいて8,000万件以上の患者・医師間の会話を処理する見込みであり、評価額は53億ドルに達する。本エピソードでは、Abridgeのプロダクト責任者であるJanie Lee(ジェイニー・リー)と、臨床判断支援を担当するChaitanya "Chai" Asawa(チャイ・アサワ)が、同社の技術的挑戦とビジョンの全貌を語った。
ホストのswyxとAlessio Fanelli、そしてRedpointのJacob Effronを交えたクロスオーバー対談は、単なるプロダクト紹介に留まらない。医療AIの最前線で実際に起きている「文脈の王権」をめぐる戦い、リアルタイム処理と高品質と低コストのトレードオフ、HIPAA準拠とデータ活用の両立、そして「80対20の法則が通用しない」高リスク領域ならではの評価とロールアウトの思想まで、極めて実践的で深い議論が展開された。特に、Gleanの初期エンジニアとして検索の品質にこだわったChaiの視点と、プロダクト開発の現場で「PRDは死んだ」という通説に異を唱えるJanieの姿勢は、AIエンジニアにとって示唆に富む。
臨床文書作成から臨床インテリジェンス層へ:Abridgeの三幕構成
Abridgeのプロダクト進化は、明確な三幕構成で語られる。第一幕は「時間の節約」だ。医師は診療後、自宅でパジャマ姿で深夜まで診療記録の作成に追われる——いわゆる「パジャマタイム」が業界の深刻な問題だった。Abridgeの最初のプロダクトは、この文書作成の負荷を劇的に軽減し、医師が週に10〜20時間もの時間を節約できるようにした。Janie Leeは「Abridgeのおかげで離婚しなくて済んだ」「初めて子供と夕食を食べられるようになった」といった顧客の声を「Love Stories」というSlackチャンネルで共有していると語る。この時間節約は、単なる効率化ではなく、医師の burnout(燃え尽き症候群)や離職率の改善、ひいては医師不足という国家的課題への対処に直結する。
第二幕は「医療システムの収益改善」だ。米国の医療システムは記録的な低い営業利益率で運営されており、患者へのサービス提供がますます困難になっている。Abridgeは、よりコンプライアンスに準拠した文書作成や、請求チームからの問い合わせ削減を通じて、医療システムの「支出削減」と「収益向上」に貢献する。Janieは「投資した1ドルに対して、どれだけのリターンがあるかをCFOに示さなければならない」と強調する。第三幕は「命の救済」だ。Abridgeのソフトウェアが週に数百万回、患者が診察室に入る前、診察中、診察後に開かれているという事実は、臨床判断支援(Clinical Decision Support)などのプロダクトを通じて、患者の転帰を直接改善する巨大な機会を提供する。
Chai Asawaは、この三幕構成を「時間を節約し、金を節約し、命を救う」と端的に要約する。そして、このすべての基盤にあるのが「患者と医師の会話」というワークフローだ。米国のGDPの20%を占める医療費のほぼすべては、この会話から派生する——診断、治療、請求、支払い、すべてがその派生形である。Abridgeはこの「最も重要なワークフロー」を捉えることで、医療システム全体に影響を及ぼす独自のポジションを築いている。
文脈こそ王:Gleanで培われた検索の哲学が医療で進化する
Chai Asawaは、Gleanの初期エンジニアとして検索の品質にこだわった経験を持つ。彼は「あらゆるAI製品の波には共通のパターンがある」と指摘し、GleanとAbridgeの核心的な共通点を「文脈こそが王(context is king)」という一言に集約する。どちらのプロダクトも、優れたモデルを実際に機能させるのは文脈であり、文脈こそがAIを「ただのデモ」から「実用的なツール」に変えるのだという。
しかし、医療という領域は、Gleanが扱うエンタープライズ検索とは根本的に異なる難しさがある。第一に、ダウンサイドリスクの大きさだ。Gleanで検索結果が間違っていても「質問を間違えた」程度で済むが、医療では患者がアレルギーを持つ薬を処方してしまうなど、致命的な結果を招く可能性がある。このリスクの高さが、Abridgeの評価戦略や段階的ロールアウトの考え方を根本から形作っている。第二に、垂直特化型であることの利点だ。Gleanは水平型で多様な企業やペルソナを扱うが、Abridgeは医療という垂直領域に集中している。これにより、プロダクトの焦点を絞り込み、これまで労働力とプロセスで解決されてきた問題をAIで置き換えることに注力できる。
第三に、そして最も重要な違いは、Abridgeが「アンビエント(環境常駐型)」であることだ。同社のプロダクトは常にバックグラウンドで「聴いて」おり、ユーザーが能動的に操作する必要がない。Chaiはこれを「10年間のハッカソンで毎回登場したJarvisのビジョンを、Abridgeは実際に実現しつつある」と評する。AIが「エアコンのように」常に存在し、本当に必要な時だけ介入する——この思想が、Abridgeのプロダクトデザインの根底にある。
アラート疲れを超えて:プロアクティブな知性と事前承認のリアルタイム化
医療現場におけるアラート(警告)の歴史は、ほとんどが失敗の歴史でもある。従来のアラートは90%以上が無視されてきた。Janie Leeは、この問題の解決策を「リアクティブなアラートからプロアクティブな知性への転換」に見出す。具体的には、診察中に医師を中断するのではなく、診察前に医師が患者の情報を事前に把握できるようにするのだ。例えば、過去数ヶ月の診療記録を要約し、今回の受診理由に基づいて議論すべき項目を提示する。これにより、医師は「冷えた状態」で診察室に入るのではなく、準備万端で臨める。
しかし、診察中に介入すべきケースも存在する。その代表例が「事前承認(Prior Authorization)」だ。米国の医療保険では、MRIなどの高額な検査や処置には保険会社の事前承認が必要であり、承認が下りるまでに数週間を要することが多い。患者は診察室で医師からMRIを処方され、後日「承認されませんでした」と電話で知らされる——この非効率をAbridgeは根本から変えようとしている。
Abridgeのプロダクトは、診察中にリアルタイムで保険会社のポリシーを参照し、患者の保険プランや病状に照らして、承認に必要な条件を満たしているかを瞬時に判断する。例えば「カリフォルニア州のAetnaプランでは、MRIの承認には6週間以上の理学療法の実施が必要」といったルールを、患者が診察室を去る前に医師に伝える。これにより、承認プロセスが「数週間後」から「診察中の2分間」に短縮される。Janieは「時間を節約し、金を節約し、命を救う——この3つすべてを同時に達成できる」と語る。
この事前承認のユースケースは、医療AIの難しさと可能性を如実に示している。保険会社のポリシーは州ごとに異なり、ウェブサイトに掲載されているものもあれば、50ページのPDFに埋もれているものもある。さらに、患者の過去の検査結果や画像診断データを電子健康記録(EHR)から取得し、それらを統合して判断を下す必要がある。Chaiは「この複雑さが参入障壁(moat)を生み出す」と指摘する。単なるモデルの性能だけでなく、データの統合とワークフローの設計が競争優位の源泉となるのだ。
フォームファクターとマルチステークホルダー:モバイル、デスクトップ、そして未来のAR
Abridgeのプロダクトは、主にモバイルとデスクトップの2つのフォームファクターで提供される。医師は診察室を出入りする際にモバイル端末を使用し、一日の終わりにノートをまとめたり翌日の準備をする際にはデスクトップを使う。しかし、同社はさらに先を見据えている。特に看護師向けのプロダクトでは、2分間の患者チェックのためにアプリを起動するのが非効率であることから、診察室に常設されたデバイス(in-room device)との連携が重要になる。Google Meetのような会議室用デバイスを医療現場に応用するイメージだ。
さらに長期的には、ARグラス(拡張現実メガネ)の可能性も視野に入れている。外科手術の現場では、ARを使って体内の画像を重ね合わせる試みが既に行われている。Abridgeも、画面を介さずに医師に情報を提供し、患者とのアイコンタクトを維持しながら診療を支援する未来を構想している。ただし、Janieは「これは近い将来のロードマップではない」と断りを入れつつも、大手医療システムとの統合が進むにつれて、ARがもたらすプロダクトの可能性は大きいと語る。
Abridgeの顧客は多層的だ。購買決定者(buyer)は、医療システムの最高医療情報責任者(CMIO)、最高財務責任者(CFO)、最高情報責任者(CIO)である。一方、実際のユーザーは医師や看護師といった臨床家だ。そして、その先には患者がいる。さらに、保険会社(payer)や製薬会社(pharma)も、Abridgeのデータを間接的に利用するステークホルダーとなる。Janieは「プロダクトを構築する際には、誰のために作っているのか、二次的なユーザーは誰なのか、そしてそれがセキュリティやコンプライアンス、ROIにどのような意味を持つのかを常に考えている」と語る。この複雑なステークホルダー構造を理解し、それぞれに価値を提供できることが、医療AI企業に求められる重要な能力である。
医療AIの最も難しい問題:リアルタイム、高品質、低コストのトリレンマ
Abridgeが直面する最も難しいAIの問題は、リアルタイム性、高品質、低コストという3つの要求を同時に満たすことだ。Chaiはこれを「AIプロダクトの3大KPI」と呼び、特に事前承認のユースケースでは、このトリレンマが極めて顕著になると説明する。診察中にリアルタイムでガイダンスを提供するためには、高度な知能を持つモデルが必要だが、高品質なモデルは遅く、高コストだ。一方、安価で高速なモデルは品質が不十分で、アラート疲れを引き起こす。
この課題に対するAbridgeのアプローチは、複数のモデルを組み合わせた「モデル群(constellation of models)」戦略だ。まず、高速で安価なモデルで一次的なトリアージを行い、必要に応じてより高知能なモデルに引き継ぐ——いわゆる「考える速さと遅さ(Thinking, Fast and Slow)」のアプローチである。さらに、保険会社のポリシーを中間表現(intermediate representation)にモデル化するなど、エンジニアリングの工夫で問題を扱いやすくしている。Chaiは「パレートフロンティアは常に変化しているが、今すぐ使えるプロダクトを構築するためには、これらの工夫が必要だ」と語る。
モデル戦略において、Abridgeは独自のデータが最大の強みであると認識している。同社は数千万件、いや数億件に迫る医療会話のデータセットを持っている。これは「患者と医療提供者の間のトレース」であり、医療におけるデバッグ情報に相当する。この独自データを使って、転写(transcription)や話者分離(diarization)、診療記録生成などのモデルを自社でファインチューニングし、サードパーティのモデルよりも高品質かつ低コストで提供できる。同時に、OpenAIやAnthropicなどのモデルプロバイダーとも緊密に連携し、彼らが医療データで学習を進めることで、汎用モデルの医療知識が向上することを歓迎している。「我々は最終的に最高のプロダクト体験だけを気にしている」とChaiは言う。
また、Chaiは「あらゆるエージェントは、その内部ではコーディングエージェントである」という洞察を共有する。モデルがよりエージェント的になるにつれて、EHR(電子健康記録)は「エージェントのためのファイルシステム」として機能するようになる。EHRには膨大な情報が格納されているが、現在のモデルのコンテキストウィンドウには収まらない。しかし、エージェントがそのデータを読み書きできるようになれば、Abridgeのプロダクトは直接的に恩恵を受ける。このように、モデルの進化の方向性を予測し、それに合わせた戦略を立てることが、同社の技術的優位性を支えている。
パーソナライゼーションと評価:スロップを避け、信頼を積み上げる
医療AIにおいて、パーソナライゼーションは単なる「好み」の問題ではない。医師が作成する診療記録は、その医師の診療スタイルを深く反映した「作品」であり、スタイルの不一致はプロダクトの拒絶に直結する。Janie Leeは、Abridgeがパーソナライゼーションを3つのレベルで考えていると説明する。第一に、個人レベル——箇条書きか段落か、簡潔か包括的か、特定のフレーズの使用、さらには「文と文の間に2つのスペースを入れたい」といった細かい好みまで対応する。第二に、専門分野レベル——循環器内科医と皮膚科医では、診療記録の構造も評価基準もまったく異なる。第三に、医療システムレベル——各医療システムは長年かけて培った独自の診療ガイドラインを持っており、それをプロダクトに組み込むことが求められる。
このパーソナライゼーションの文脈で、Chaiは「AIスロップ」という概念を提起する。「スロップとは、文脈のないAIのことだ」と彼は定義する。Abridgeは豊富な文脈を持ち、医師の編集履歴や好みを「メモリ」として蓄積することで、データフライホイールを回している。このメモリは、モデルの重みに直接組み込むのではなく、外部ストアとして保持することで、モデルの急速な進化に柔軟に対応できる設計になっている。
評価(eval)のプロセスも、医療ならではの厳格さを持つ。Abridgeは「LFD(Look at the F***ing Data)」という社内プロセスを重視する。これは、単に評価指標の数字を追うのではなく、実際のデータを人間が目で見て確認するという、MLの世界ではよく知られたプラクティスだ。社内の臨床医(clinician scientist)が一次評価を行い、その後、LLMを評価者(LLM judge)として活用する。さらに、必要に応じて社外の第三者評価者も起用する。評価は専門分野ごとに異なる基準で行われ、数百から数千のオフラインサンプルを用いて、プロダクションに出す前に徹底的に検証する。
特筆すべきは、段階的ロールアウト(progressive rollout)の思想だ。従来のコンシューマー向けプロダクトでは「アルファ版を出して、翌週にはGA(一般提供)」というスピード感が求められるが、医療ではそれが許されない。Abridgeは、オフライン評価だけでは実際の分布を完全に再現できないという認識から、早期に実環境でテストし、フィードバックを得ることを重視する。同社は顧客との信頼関係を「一滴ずつ得て、バケツ単位で失う」と表現し、四半期や年2回だったリリースサイクルを月次に短縮し、さらに一部の顧客とは共同開発の関係を築いている。この信頼の構築こそが、医療AI企業にとって最も重要な資産の一つである。
HIPAA、プライバシー、そして100万回の会話がもたらすスケールの課題
医療データの取り扱いにおいて、HIPAA(医療保険の携行性と責任に関する法律)への準拠は絶対条件である。Abridgeは、評価や学習に使用するすべてのデータを「匿名化(de-identification)」する必要がある。具体的には、臨床会話のトランスクリプトから、患者を特定できる情報(PHI:Protected Health Information)を除去するモデルを自社で構築している。この匿名化は「一方通行(one-way)」であり、一度匿名化されたデータを元に戻すことはできない。また、顧客契約には、誰がPHIデータにアクセスできるか、どの程度の期間保持した後に匿名化するかが厳格に定められている。
しかし、この厳格なプライバシー保護の枠組みの中で、Abridgeは独自のデータ資産を活用している。同社は現在、数千万件、そして1億件に迫る医療会話のデータセットを持っている。このデータは「これまで捕捉されたことのないデータソース」であり、そこから得られる洞察は計り知れない。例えば、どの治療法が効果的か、医師のコーチングにどう活かせるか——これらは従来、医師の経験と勘に依存していた領域だ。Jacob Effronは「平均的ながん患者に『あなたの経験を他の患者の学習に使ってもいいか』と尋ねれば、ほとんどの人が喜んで同意する」と指摘し、テクノロジーの進化がこの種の学習をより実用的にすると述べる。
100万回の会話を超えるスケールで運用することは、インフラストラクチャにも大きな課題を突きつける。プロトタイプ段階では最も高価なモデルを自由に使えても、この規模になるとコストが無視できなくなる。Abridgeは、自社のデータを使ってポストトレーニング(事後学習)を行い、特に品質の頭打ちが見られる領域では、計算効率とトークン効率を最大化する。Chaiは「リーダーボードはこの文脈ではあまり意味をなさない」と語る。スケールが大きくなればなるほど、実運用でのコストと品質のバランスが重要になるのだ。
EHRとの統合とエコシステムの未来
Abridgeの成功は、電子健康記録(EHR)との深い統合なしにはありえない。EHRは医師が一日の大半を過ごす場所であり、プロダクトがEHRとシームレスに連携できない限り、医療システムは導入に同意しない。Janie Leeは「EHRとの統合はtable stakes(参加条件)だ」と断言する。Abridgeは、主要なEHRベンダーと緊密なパートナーシップを築き、標準のAPIでは実現できないデータのプッシュとプルを可能にしている。医師にとって「クリック数の削減」は極めて重要であり、新しいプロダクトが2クリック増えるだけで使われなくなる。
戦略的な観点では、EHRベンダーが何を自社で開発し、何をパートナーに委ねるかという線引きが重要になる。EHRベンダーは伝統的に臨床ワークフローに注力しており、保険会社と医療提供者を結ぶ事前承認や、臨床試験のマッチングといった領域は、彼らのドメイン外であることが多い。Abridgeは、自社を「医療提供者、製薬会社、保険会社を横断する新しい臨床インテリジェンス層」と位置づけ、EHRとは異なるレイヤーで価値を提供する。
Chaiは、将来のAIインフラストラクチャについて興味深い見解を示す。モデルがよりエージェント的になるにつれて、人間のために作られてきたツール——KafkaやTemporalのようなイベント駆動型システム、ソケット通信、CRDT(コンフリクトフリー複製データ型)——が、エージェントのためのインフラとして再び重要性を増すという。Google Docsで人間が協調するために使われてきたパターンが、マルチエージェントシステムのコンフリクト解決に応用されるのだ。この視点は、AIエンジニアにとって、単に最新のモデルを追いかけるだけでなく、分散システムの古典的な知恵を再評価する必要性を示唆している。
結びに:医療がAIの最難関を解く
本エピソードを通じて一貫して感じられるのは、Abridgeが単なる「AIを医療に適用した企業」ではないということだ。同社は、医療という高リスク領域の厳しい要求——ゼロエラーに近い評価、マルチステップワークフローの信頼性、リアルタイム性とコストの両立——を正面から受け止め、それらを技術的な挑戦として楽しんでいる。Chaiが「80対20の法則はここでは通用しない」と語るように、医療AIは「とりあえず動く」では許されない。しかし、だからこそ、この領域で磨かれた技術と知見は、他のどの領域よりも先を行く可能性を秘めている。
Janie Leeが「PRDは死んだ」という通説に異を唱えたのも印象的だ。プロトタイプが全てを解決するという風潮に対して、彼女は「複雑なプロダクトでは、なぜこの問題を解くのか、なぜ自社が解くべきなのか、という戦略的な問いに答える文書が不可欠だ」と主張する。この「クリエイティブな明確さ(crisp written clarity)」へのこだわりは、AIの民主化が進むほど、むしろ重要性を増すだろう。医療AIの最前線で働くエンジニアたちは、単なるコーディング能力だけでなく、領域知識、評価設計、顧客との信頼構築、そして戦略的思考を兼ね備えることが求められている。Abridgeの物語は、AIエンジニアにとって、これからの時代に必要なスキルセットのロードマップを示していると言える。
要点
- Abridgeは2018年創業、臨床文書作成の自動化からスタートし、現在は診療の前・中・後をカバーする「臨床インテリジェンス層」へと進化。2025年には250以上の医療システムで8,000万件以上の会話を処理し、評価額は53億ドルに達する。
- 医師の「パジャマタイム」(深夜の診療記録作成)を解消し、週に10〜20時間を節約。これによりburnout防止や離婚防止といった、医療現場の深刻な人的課題に直接貢献している。
- 事前承認(Prior Authorization)のリアルタイム化が象徴的なユースケース。保険会社のポリシー、患者データ、EHR情報を統合し、診察中に承認条件を満たすためのガイダンスを提供。従来数週間かかっていたプロセスを2分に短縮する。
- 「文脈こそが王(context is king)」というGleanで培われた哲学を医療に応用。ただし、ダウンサイドリスクの大きさから、評価戦略や段階的ロールアウトの厳格さはGleanとは桁違い。医療AIは「80対20の法則」が通用しない領域である。
- モデル戦略は「モデル群(constellation of models)」アプローチ。高速・低コストなモデルでトリアージし、高知能モデルに引き継ぐ。数千万件の医療会話データを活用した自社ファインチューニングが競争優位の源泉。
- 評価プロセスは「LFD(Look at the F***ing Data)」に始まり、社内臨床医、LLM評価者、第三者評価者を組み合わせた多層構造。専門分野ごとに異なる評価基準を持ち、数百〜数千のオフラインサンプルで検証した上で段階的にロールアウトする。
- パーソナライゼーションは個人、専門分野、医療システムの3層で実施。医師の編集履歴や好みを「メモリ」として外部ストアに保持し、モデルの進化に柔軟に対応。文脈のないAIを「スロップ」と定義し、それを避けるためのデータフライホイールを構築している。
- 「あらゆるエージェントはコーディングエージェント」という洞察のもと、EHRをエージェントのファイルシステムと捉える。将来のAIインフラは、KafkaやTemporal、CRDTなど人間のために作られたツールがエージェントの基盤として再評価される。