山田 育矢
株式会社Studio Ousia チーフサイエンティスト
東北大学 言語AI研究センター
特任教授(客員)
名古屋大学
数理・データ科学・人工知能教育研究センター 客員教授
理化学研究所 革新知能統合研究センター 客員研究員
人の役に立つ新しい技術を継続的に生み出すことを目標に活動しています。
現在は、自然言語処理・大規模言語モデルの研究開発に取り組んでいます。
博士(学術)。Kaggle
Master。
What's New
2025年7月
東北大学の特任教授(客員)に着任しました
2024年9月
新しい書籍「大規模言語モデル入門Ⅱ〜生成型LLMの実装と評価」が技術評論社から出版されました
2024年9月
名古屋大学の客員教授に着任しました
2024年6月
DICOMO
2024にて「大規模言語モデルの技術と最新動向」と題した招待講演を行いました
2024年5月
ACL
Rolling
Review(言語処理系トップ国際会議の査読システム)のsenior
action editorになりました
これまでの主な仕事

大規模言語モデル入門シリーズの執筆
大規模言語モデルの理論と実装の双方の側面から解説した入門書を企画し、監修・共著しました。2023年に大規模言語モデル入門、2024年に大規模言語モデル入門IIが出版されました。
リンク:

言語モデルの研究開発
大規模言語モデル/訓練済み言語モデルの研究開発に取り組んでいます。2020年に発表した知識強化言語モデルLUKEは、幅広い自然言語処理タスクで世界最高性能を達成し、世界中で幅広く使われています。関連論文は2025年現在で合計1,000引用をこえています。
リンク:

質問応答の研究開発
AIが質問に回答する質問応答の研究開発に取り組んでいます。開発したAIは複数の国際コンペティションで評価されており、NIPS
2017 Human-Computer
QAコンペティションでは世界最高性能を獲得し、AIと人間の全米クイズ王6人のチームとの対戦に大差で勝利しました。
NeurIPS
2020
EfficientQAコンペティションでは、制約トラックでFacebookに次いで準優勝、無制約トラックでMicrosoft、Facebookに次いで3位を獲得しました。
リンク:

固有表現認識・リンキングの研究開発
テキスト中のエンティティ(固有名詞や用語)を高精度に認識するタスクに取り組んでいます。
開発した技術はWWW 2015 NEEL ChallengeとACL2015 W-NUT
Shared Taskの2つの国際コンペティションにおいて、連続して最高性能を獲得しました。
エンティティをベクトルで表現する手法であるWikipedia2Vecは世界中で広く使われています。
執筆
-
大規模言語モデル入門Ⅱ〜生成型LLMの実装と評価
山田育矢 (著・監修), 鈴木正敏, 西川荘介, 藤井一喜, 山田康輔, 李凌寒
技術評論社, 2024 -
大規模言語モデル入門
山田育矢 (著・監修), 鈴木正敏, 山田康輔, 李凌寒
技術評論社, 2023 -
ディープラーニングによる自然言語処理
山田育矢, 柴田知秀, 進藤裕之, 玉木竜二
共立出版, 2023 -
自然言語処理技術
鈴木潤, 土屋誠司, 本橋和貴, 高橋寛治, 田村晃裕, 山田育矢, 荒木健治, 森信介, 渡邉信一, 原紳, 水本智也, 清水武
情報機構, 2020 -
Pythonによるはじめての機械学習プログラミング
島田達朗, 越水直人, 早川敦士, 山田 育矢
技術評論社, 2019
論文のリストはGoogle Scholarを参照してください。
受賞
以下の国際コンペティションで上位入賞しました。
2位
NeurIPS 2020 Efficient
Open-Domain Question Answering Competition(restricted 6GB track)
3位
NeurIPS 2020 Efficient
Open-Domain Question Answering Competition(unrestricted track)
2位
WSDM Cup 2017 Triple Scoring Task
1位
Shared Task in NAACL 2016 Workshop on Human-Computer QA
1位
Shared Task #1 in ACL 2015 Workshop on Noisy
User-generated Text (W-NUT 2015)
1位
NEEL Challenge in WWW 2015 Workshop on Making Sense of
Microposts
経歴
大学入学時に株式会社ニューロンを起業し、学業と並行してビジネスに取り組みました。その後、株式会社Studio Ousiaを共同創業し、自然言語処理・大規模言語モデルの研究開発に取り組んでいます。
2000年
慶應義塾湘南藤沢高等部 卒業
2000年
株式会社ニューロン 代表取締役
2003年
株式会社フラクタリスト 取締役技術戦略担当(株式会社ニューロンを売却)
2005年
慶應義塾大学環境情報学部 卒業
2007年
株式会社Studio Ousia 代表取締役
2011年
慶應義塾大学大学院政策・メディア研究科 修士課程 修了
2016年
慶應義塾大学大学院政策・メディア研究科 博士課程 修了。博士(学術)
2018年
理化学研究所 革新知能統合研究センター 客員研究員(現任)
2023年
株式会社Studio Ousia チーフサイエンティスト(現任)
2024年
名古屋大学 数理・データ科学・人工知能教育研究センター 客員教授(現任)
2025年
東北大学 言語AI研究センター 特任教授(客員)(現任)
主な講演
- 大規模言語モデルの技術と最新動向(2024年6月, 情報処理学会DICOMO 2024)
- 言語間転移学習で大規模言語モデルを賢くする(2024年3月, 言語処理学会第30回年次大会ワークショップ「生成AI時代の自然言語処理における産学官の役割と課題」)
- 最先端の質問応答技術の研究開発と迅速な実用化(2023年3月, 情報処理学会 第255回自然言語処理研究会)
- 知識拡張型言語モデルLUKE(2023年3月, 言語処理学会第29回年次大会ワークショップ「日本語言語資源の構築と利用性の向上」)
- Studio Ousiaの技術開発の取り組みとAWSの活用(2021年5月, AWS Summit Online Japan)
- エンティティエンベディングの学習とその活用(2021年4月, 理化学研究所AIP 森羅2021-LinkJPキックオフミーティング)
- オープンドメイン質問応答技術の最新動向(2021年3月, 言語処理学会第27回年次大会ワークショップ「AI王 〜クイズAI日本一決定戦〜」)
- 知識ベースの自然言語処理への活用 (2020年12月, 第22回音声言語シンポジウム兼第7回自然言語処理シンポジウム)
- 実践!AllenNLPによるディープラーニングを用いた自然言語処理 (2020年10月, 言語処理学会 言語処理技術セミナー)
- 自然言語処理の開発現場でのAWS活用術 ーリサーチからデプロイまでー (2019年10月, AWS DevDay Tokyo)
- PythonによるWikipediaを活用した自然言語処理 (2018年10月, PyData.tokyo One-day Conference)
- 自然言語処理にWikipediaを活用する (2018年9月, 国立国語研究所 コーパスとしてのウェブテキスト活用シンポジウム)
- 自然言語処理を使って”賢い”人工知能を作る (2018年5月, 慶應義塾大学SFC 現代技術と社会)
- 全米クイズ王チームに勝利した早押しクイズAIの仕組み (2018年4月, PyData.Tokyo Meetup #18 データ分析コンペティションの勝ち上がり方)
- 知識ベースを活用した自然言語処理の手法とその応用 (2018年3月, ステアラボ人工知能シンポジウム 2018)
- Pythonを使って言語処理のコンペティションにチャレンジ (2015年10月, PyData.Tokyo Meetup #6 データマイニングコンペティション)
- 知識ベースを活用したエンティティリンキング (2015年7月, 人工知能学会 第36回セマンティックウェブとオントロジー研究会)