UMIN試験ID | UMIN000053582 |
---|---|
受付番号 | R000061116 |
科学的試験名 | メンタルヘルス・マネジメント(R)検定試験に対するChatGPT (Generative Pretrained Transformer-4, GPT-4) のパフォーマンス:要因計画による検討 |
一般公開日(本登録希望日) | 2024/02/09 |
最終更新日 | 2024/09/25 10:06:22 |
日本語
メンタルヘルス・マネジメント(R)検定試験に対するChatGPTのパフォーマンス:要因計画による検討
英語
Performance of the ChatGPT on the Certification Test for Mental Health Management: Factorial design
日本語
メンタルヘルス・マネジメント(R)検定試験に対するChatGPTのパフォーマンス
英語
Performance of the ChatGPT on the Certification Test for Mental Health Management
日本語
メンタルヘルス・マネジメント(R)検定試験に対するChatGPT (Generative Pretrained Transformer-4, GPT-4) のパフォーマンス:要因計画による検討
英語
Performance of the ChatGPT (Generative Pretrained Transformer-4) on the Certification Test for Mental Health Management: Factorial design
日本語
メンタルヘルス・マネジメント(R)検定試験に対するChatGPT (Generative Pretrained Transformer-4, GPT-4) のパフォーマンス
英語
Performance of the ChatGPT (Generative Pretrained Transformer-4) on the Certification Test for Mental Health Management
日本/Japan |
日本語
該当なし
英語
NA
該当せず/Not applicable |
悪性腫瘍以外/Others
いいえ/NO
日本語
本研究では、近年目覚ましい発展を遂げる大規模言語モデル (LLM) が、職場のメンタルヘルスに関する知識を問われる試験課題においてどの程度のパフォーマンスを発揮するか検討することを目的とする。また、LLMに入力するプロンプトに工夫を加えることによって、LLMのパフォーマンスが向上するかどうかも検討する。研究では、代表的なLLMであるChatGPT (Generative Pretrained Transformer-4, GPT-4) を用い、試験課題として大阪商工会議所が主催するメンタルヘルス・マネジメント(R)検定試験を採用し、その得点を検討する。検討においては、試験問題をプロンプトとして入力する条件 (単純プロンプト条件) と、これまでにLLMのパフォーマンスを向上させることが確認されているテクニックを使用したプロンプトを入力する条件 (調整プロンプト条件) の2条件を用意し、4回分の試験課題の得点を比較する。
英語
The present study aims to examine the performance of large language models (LLMs) on an examination that requires knowledge of occupational mental health. In addition, the study investigates whether tuned prompts can improve LLM performance. The study adopts ChatGPT (Generative Pretrained Transformer-4, GPT-4) as the LLM, and adopts the Certification Test for Mental Health Management organized by the Osaka Chamber of Commerce and Industry as the examination. We set two prompt conditions as factorial design: simple texts of questions (simple prompt condition), and texts with techniques to get better results (tuned prompt condition). The scores of four sets of examinations are compared between these two conditions.
有効性/Efficacy
日本語
英語
探索的/Exploratory
実務的/Pragmatic
該当せず/Not applicable
日本語
メンタルヘルス・マネジメント(R)検定試験における選択問題、および論述問題の得点
英語
Scores for multiple-choice and essay questions of the Certification Test for Mental Health Management
日本語
英語
介入/Interventional
要因デザイン/Factorial
非ランダム化/Non-randomized
介入実施者・測定者がブラインド化されている単盲検/Single blind -investigator(s) and assessor(s) are blinded
実薬・標準治療対照/Active
2
教育・カウンセリング・トレーニング/Educational,Counseling,Training
その他/Other |
日本語
調整プロンプト条件
この条件では、プロンプトエンジニアリングの領域においてこれまでにLLMのパフォーマンスを向上させることが確認されているテクニックを使用して試験問題に回答するためのプロンプトを作成し、LLMに入力する。テクニックには、制約の設定、出力のフォーマットの指定、few-shot prompting、chain of thought等を含む。
英語
Tuned prompt condition
In this condition, prompts to the LLM are developed by using techniques to get better answers to the examination, which were reported in prompt engineering. The techniques include constraint, indicating the format of the output, few-shot prompting, and chain of thought.
日本語
単純プロンプト条件
この条件では、メンタルヘルス・マネジメント(R)検定試験で実際に出題された試験問題をそのままプロンプトとして入力する。
英語
Simple prompt condition
In this condition, prompts consist simply of the plain texts of questions in the examination.
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
適用なし/Not applicable |
適用なし/Not applicable |
男女両方/Male and Female
日本語
2018年~2023年に実施された、大阪商工会議所メンタルヘルス・マネジメント(R)検定試験におけるI種試験、Ⅱ種試験、Ⅲ種試験の選択問題、およびI種試験における論述問題。
I種試験は第27回、29回、31回、および33回の4回分。Ⅱ種・Ⅲ種試験は第31回~34回の4回分。
選択問題は四者択一で、1回あたり50問。論述問題は採点委員による採点。
英語
Multiple-choice questions for the Type I, Type II, and Type III exams and essay questions for the Type I exam of the Certification Test for Mental Health Management, by the Osaka Chamber of Commerce and Industry, conducted from 2018 to 2023.
A total of four exams from each type will be included in the study: Type I exams from the 27th, 29th, 31st, and 33rd; Type II and Type III exams from the 31st to 34th. Each exam has 50 multiple-choice questions. A scoring committee grades essay questions.
日本語
なし
英語
N/A
204
日本語
名 | 憲人 |
ミドルネーム | |
姓 | 川上 |
英語
名 | Norito |
ミドルネーム | |
姓 | Kawakami |
日本語
東京大学大学院医学系研究科
英語
Graduate School of Medicine, The University of Tokyo
日本語
社会連携講座 デジタルメンタルヘルス講座
英語
Department of Digital Mental Health
113-8655
日本語
東京都文京区本郷7-3-1
英語
7-3-1 Hongo, Bunkyo-ku, Tokyo 113-8655, Japan
+81-3-5800-9621
norito@m.u-tokyo.ac.jp
日本語
名 | 真子 |
ミドルネーム | |
姓 | 飯田 |
英語
名 | Mako |
ミドルネーム | |
姓 | Iida |
日本語
東京大学大学院医学系研究科
英語
Graduate School of Medicine, The University of Tokyo
日本語
精神保健学分野
英語
Department of Mental Health
113-8655
日本語
東京都文京区本郷7-3-1
英語
7-3-1 Hongo, Bunkyo-ku, Tokyo 113-8655, Japan
+81-3-5800-9621
idamako@m.u-tokyo.ac.jp
日本語
その他
英語
Department of Digital Mental Health, Graduate School of Medicine, The University of Tokyo
日本語
東京大学大学院医学系研究科社会連携講座 デジタルメンタルヘルス講座
日本語
日本語
英語
日本語
その他
英語
Department of Digital Mental Health, Graduate School of Medicine, The University of Tokyo
日本語
東京大学大学院医学系研究科デジタルメンタルヘルス講座
日本語
自己調達/Self funding
日本語
英語
日本語
英語
日本語
英語
日本語
東京大大学院医学系研究科・医学部倫理委員会
英語
Office for Human Research Studies(OHRS) Graduate School of Medicine and Faculty of Medicine, The University of Tokyo Faculty of Medicine
日本語
113-0033 東京都文京区本郷7-3-1
英語
7-3-1 Hongo, Bunkyo-ku, Tokyo 113-0033
03-5841-0818
ethics@m.u-tokyo.ac.jp
いいえ/NO
日本語
英語
日本語
英語
2024 | 年 | 02 | 月 | 09 | 日 |
未公表/Unpublished
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
日本語
英語
主たる結果の公表済み/Main results already published
2024 | 年 | 01 | 月 | 29 | 日 |
2024 | 年 | 01 | 月 | 29 | 日 |
2024 | 年 | 01 | 月 | 29 | 日 |
2024 | 年 | 03 | 月 | 31 | 日 |
日本語
生成系AIを用いた研究であり、人を対象としていないため、倫理審査は不要。
倫理委員会による承認日は仮の日付としてプロトコル確定日を入力した。
英語
Approval by the ethics committee is not required because this study will be conducted using generative AI.
I entered the date of protocol fixation as the date of the IRB.
2024 | 年 | 02 | 月 | 09 | 日 |
2024 | 年 | 09 | 月 | 25 | 日 |
日本語
https://center6.umin.ac.jp/cgi-open-bin/ctr/ctr_view.cgi?recptno=R000061116
英語
https://center6.umin.ac.jp/cgi-open-bin/ctr_e/ctr_view.cgi?recptno=R000061116