| UMIN試験ID | UMIN000054461 |
|---|---|
| 受付番号 | R000062206 |
| 科学的試験名 | 大規模言語モデルを用いたシステマティックレビューにおけるデータ抽出の精度と信頼性の検証 |
| 一般公開日(本登録希望日) | 2024/05/23 |
| 最終更新日 | 2026/05/24 12:37:44 |
日本語
大規模言語モデルを用いたシステマティックレビューにおけるデータ抽出の精度と信頼性の検証
英語
Accuracy and reliability of data extraction for systematic reviews using large language models: A protocol for a prospective study
日本語
大規模言語モデルを用いたシステマティックレビューにおけるデータ抽出の精度と信頼性の検証
英語
Accuracy and reliability of data extraction for systematic reviews using large language models: A protocol for a prospective study
日本語
大規模言語モデルを用いたシステマティックレビューにおけるデータ抽出の精度と信頼性の検証
英語
Accuracy and reliability of data extraction for systematic reviews using large language models: A protocol for a prospective study
日本語
大規模言語モデルを用いたシステマティックレビューにおけるデータ抽出の精度と信頼性の検証
英語
Accuracy and reliability of data extraction for systematic reviews using large language models: A protocol for a prospective study
| 日本/Japan |
日本語
敗血症
英語
Sepsis
| 救急医学/Emergency medicine | 集中治療医学/Intensive care medicine |
悪性腫瘍以外/Others
いいえ/NO
日本語
3つのLLM(GPT-4 Turbo、Claude 3、Gemini 1.5 Pro)を用いて、J-SSCG 2024のシステマティックレビュープロセスにおいて、選択された文献から抽出されたデータの精度と信頼性を評価すること。
英語
To evaluate the accuracy and reliability of the extracted data from selected literature in the systematic review process in J-SSCG 2024 using three LLMs (GPT-4 Turbo, Claude 3, and Gemini 1.5 Pro).
その他/Others
日本語
精度と信頼性
英語
accuracy and reliability
日本語
システマティックレビュープロセスにおいて、選択された文献から抽出されたデータの精度と信頼性。
英語
To evaluate the accuracy and reliability of three large language models and optimize their command prompts to enhance accuracy.
日本語
エラーの詳細な評価と作業時間の計測
二次解析では迅速なエンジニアリング技術を統合してオリジナル・コマンドを最適化する。
英語
Detailed characteristics of errors
Time to complete each task
Following the primary analysis, we will optimize the original command with integration of prompt engineering techniques in the secondary analysis.
その他・メタアナリシス等/Others,meta-analysis etc
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
| 適用なし/Not applicable |
| 適用なし/Not applicable |
男女両方/Male and Female
日本語
適用なし
英語
Not applicable
日本語
適用なし
英語
Not applicable
日本語
| 名 | 毅彦 |
| ミドルネーム | |
| 姓 | 大網 |
英語
| 名 | Takehiko |
| ミドルネーム | |
| 姓 | Oami |
日本語
千葉大学大学院医学研究院
英語
Chiba University Graduate School of Medicine
日本語
救急集中治療医学
英語
Department of Emergency and Critical Care Medicine
260-8677
日本語
千葉県千葉市中央区亥鼻1丁目8ー1
英語
1-8-1 Inohana, Chuo, Chiba
0432227171
seveneleven711thanks39@msn.com
日本語
| 名 | 毅彦 |
| ミドルネーム | |
| 姓 | 大網 |
英語
| 名 | Takehiko |
| ミドルネーム | |
| 姓 | Oami |
日本語
千葉大学大学院医学研究院
英語
Chiba University Graduate School of Medicine
日本語
救急集中治療医学
英語
Department of Emergency and Critical Care Medicine
260-8677
日本語
千葉県千葉市中央区亥鼻1丁目8ー1
英語
1-8-1 Inohana, Chuo, Chiba
0432227171
seveneleven711thanks39@msn.com
日本語
その他
英語
Chiba University Graduate School of Medicine
日本語
千葉大学大学院医学研究院
日本語
日本語
大網 毅彦
英語
Takehiko Oami
日本語
無し
英語
Chiba University Graduate School of Medicine
日本語
千葉大学大学院医学研究院 救急集中治療医学
日本語
その他/Other
日本語
英語
日本語
英語
日本語
英語
日本語
千葉大学医学部附属病院倫理委員会
英語
Chiba University Hospital
日本語
千葉県千葉市中央区亥鼻1-8-1
英語
1-8-1 Inohana, Chuo, Chiba 260-8677, Japan
0432227171
seveneleven711thanks39@msn.com
いいえ/NO
日本語
英語
日本語
英語
千葉大学大学院医学研究院 救急集中治療医学
| 2024 | 年 | 05 | 月 | 23 | 日 |
https://www.medrxiv.org/content/10.1101/2024.05.22.24307740v1
最終結果が公表されている/Published
https://www.frontiersin.org/journals/digital-health/articles/10.3389/fdgth.2026.1799623/full
0
日本語
背景データの抽出において、エラーのない割合の平均値は、モデルごとに81.6%(ChatGPT-4o)から92.4%(Claude 3 Sonnet)の範囲であった。結果データの抽出においては、エラーのない割合の平均値は27.8%(Gemini 1.5 Pro)から80.7%(Claude 3 Sonnet)の範囲であった。
英語
For background data extraction, mean no-error proportions ranged from 81.6% (ChatGPT-4o) to 92.4% (Claude 3 Sonnet) across models. For outcome data extraction, mean no-error proportions ranged from 27.8% (Gemini 1.5 Pro) to 80.7% (Claude 3 Sonnet).
| 2026 | 年 | 05 | 月 | 24 | 日 |
日本語
英語
| 2026 | 年 | 04 | 月 | 29 | 日 |
日本語
記載なし
英語
None
日本語
記載なし
英語
None
日本語
なし
英語
None
日本語
本研究では、ChatGPT-4o、Claude 3 Sonnet、Gemini 1.5 Proの3つのLLMについて、「敗血症および敗血症性ショックの管理に関する日本臨床実践ガイドライン2024(J-SSCG 2024)」に記載された5つの臨床的疑問(CQ)を対象とした臨床試験からのデータ抽出性能を評価した。対象となる研究のPDFファイルを用いて、LLMは事前に定義された背景特性および臨床転帰を抽出した。独自に作成したプロンプトを用いて生成された出力は、思考の連鎖(chain-of-thought)および自己反省(SR)プロンプト戦略を用いて生成された出力と比較された。2名の独立した査読者が、ガイドライン作成メンバーによる手動抽出から導き出された参照基準に対して精度を評価した。また、3回のセッションにわたるセッション間の一貫性および処理時間も評価された。
英語
This study evaluated the performance of three LLMs, including ChatGPT-4o, Claude 3 Sonnet, and Gemini 1.5 Pro, for data extraction from trials addressing five clinical questions (CQs) in the Japanese Clinical Practice Guidelines for the Management of Sepsis and Septic Shock 2024 (J-SSCG 2024). Using portable document format files of eligible studies, LLMs extracted predefined background characteristics and clinical outcomes. Outputs generated using an original prompt were compared with those produced using chain-of-thought and self-reflection (SR) prompt strategies. Two independent reviewers assessed accuracy against a reference standard derived from manual extraction by the guideline members. Inter-session consistency across three sessions and processing time were also evaluated.
日本語
英語
日本語
英語
試験終了/Completed
| 2024 | 年 | 05 | 月 | 22 | 日 |
| 2024 | 年 | 05 | 月 | 22 | 日 |
| 2024 | 年 | 05 | 月 | 23 | 日 |
| 2024 | 年 | 12 | 月 | 31 | 日 |
日本語
https://medrxiv.org/cgi/content/short/2024.05.22.24307740v1
英語
https://medrxiv.org/cgi/content/short/2024.05.22.24307740v1
| 2024 | 年 | 05 | 月 | 22 | 日 |
| 2026 | 年 | 05 | 月 | 24 | 日 |
日本語
https://center6.umin.ac.jp/cgi-open-bin/ctr/ctr_view.cgi?recptno=R000062206
英語
https://center6.umin.ac.jp/cgi-open-bin/ctr_e/ctr_view.cgi?recptno=R000062206