狩野研究室は、生成AIのように日本語や英語など自然言語をコンピュータで扱う「自然言語処理」の研究をしています。言語は人間の知能の中核であり、人間の知能を探求する科学的な側面と、人間と協調する知的システムを作るという工学的な応用が表裏になる挑戦的な分野です。
このページは、大学生・高校生・一般の方向けです。研究者・企業の方、研究のより詳細を知りたい方は狩野准教授のページをご覧ください。
誤解を恐れずに一言でいえば、人間の知能の仕組みを取り入れて、生成AIを使い・作り・超える。その成果を政治・医療・法・実験科学などさまざまな分野で実用化するのが目標です。
近年、超大規模データの機械学習によるLLM(大規模言語モデル)やそれを用いた生成AIが成果を上げていますが、人間の仕組みからは離れたモデルになり必要なデータ量が多すぎること、 ブラックボックスで説明が困難であるなどの課題があります。 脳科学・認知科学的により人間に近い言語モデルの構築により、これらの点を打破することが長期的な目標です。
言葉を理解するとき、読み飛ばしたり聞き逃したりすると意味が分からなくなってしまいますし、省略された内容を補う必要もあります。 特にX(旧Twitter)に代表されるSNS(ソーシャルネットワークサービス)の書き込みは、省略や不完全な文が多く話し言葉に近い処理の難しいテキストです。省略の補完などを行いすみずみまで理解できるようにし、LLMと統合してすべての処理の基盤とします。
二つの文章の関係が、含意・矛盾・中立のいずれであるか判定することは、論理的な推論の基礎となります。以前取り組んでいたロボットは東大に入れるか(東ロボ)プロジェクトでの大学入学試験社会科の自動解答、さらに現在も取り組んでいる我が国司法試験の自動解答は、そうした判定そのものといえます。また、二つの意見が同じなのかどうかを判定し、人々の意見をグループ化したり流れを追うことを目指しています。
さまざまな個人の特性、オンライン上の意見や行動を表すデータセットを構築しています。これにより、典型的な人物タイプと行動の推測、さらに特定の人物の振る舞いの再現を試みています。また、東京大学と共同で構築した状況別極性単語辞書などを用いて、人々の感情すなわち「気持ち」の推測に取り組んでいます。
生成AIの登場により文章生成の性能は飛躍的に向上しましたが、事物や人間関係の一貫性など長い文章の生成はまだ未知数のところがあります。また、人間の言語処理は話し言葉を基盤としており、その処理に必要な要素は言語処理と音声処理の統合、相槌の生成やターンテイクなど多岐にわたります。さらに、比喩(メタファー)など重層的な意味をもつものの理解・生成を目指します。
また、嘘をつき嘘を見破る会話ゲーム「人狼」をプレイする人工知能を作成する人狼知能プロジェクトのメンバーとして自動対戦を行う自然言語部門を毎年開催しており、今のLLMに不足する点を明らかにし改善を試みています。
人狼知能プロジェクトのウェブサイト
【JSAI2024】LLM活用によって新次元に突入した人狼知能研究の可能性と限界
モリカトロン
人々の意見や気持ち、世論や社会集団的な精神状態とその変化をシミュレートします。大規模なSNS投稿データ、国会議事録、メディア記事などを用いて、個人属性や状態とSNSで受け取る情報に応じた個々人の情報拡散やいいねなどのSNSリアクション・意見や気持ちの変化を予測します。また、いわゆるフェイクニュースなど欺瞞の検出と、その拡散「バズり」の予測を試みます。
心理士と患者(うつ病・認知症・統合失調症・不安症・健常者)の会話録音を、一千時間超の世界最大規模の診断付きコーパスを構築しています。新たに客観的な基準を提供すること、さらにSNS等テキストとの紐づけでテキストからも「病気以前の未病」の検出を目標として、ソーシャルメディアのデータも用い、疾患の自動診断支援を試みています。発達障害についてもその自動スコアリングを行いました。LLMを用いたAIセラピストの作成にも取り組んでいます。慶應義塾大学病院、東京大学、国立情報学研究所、東京医科歯科大学、国立精神・神経医療研究所などと共同研究を行っています。
Newton AI
ドクターが命を救う 人工知能は医療をどう変えるか?
電子カルテ(診療録)や病理所見の処理など、医療テキストの処理を行っており、目標の一つは、医療現場を助けることのできる診断支援システムの構築です。国立病院機構の収集する大規模な電子カルテデータセットを用いて、患者の家族歴・既往歴・検査結果・所見から、どの抗がん剤が効果があり副作用が少ないかの推測を試みています。国立病院機構、浜松医科大学、日本病理学会などと共同研究を行っています。
法律関連の文書は文が長く複雑なうえ、背後に人間関係や論理構造が仮定されており高度な言語処理を必要とする分野です。
そうした法律文書の処理技術のベンチマークとして、国際コンペティションCOLIEEを毎年開催し、我が国の司法試験自動解答に挑戦しています。さらに、裁判過程の自動化支援を目標に取り組んでいます。
AIで裁判過程分析 静岡大、情報学研などと共同研究. 日本経済新聞
世界には日々膨大な量の論文が公開されており、人間ではおいきれませんが、自然言語処理によって自動的に必要な情報を抽出します。生成AIによりテキスト部分の処理能力は大幅に向上しましたが、図表の扱い、特に数値の解釈と統合、不正確な演算やハルシネーション(幻覚、間違った内容の出力)の発生抑止は未解決の課題です。
next研究室配属は主に行動情報学科の学生になりますが、情報科学科および情報社会学科からは先端情報学実習の履修者を対象に受け入れています。 研究内容や教員の人柄を知るために、狩野が担当する2年前期「AIシステムⅠ」(2024年度までは「知的情報システム開発Ⅰ」)の聴講を、初めの数回だけでもお勧めします。 また、志望を決める前に一度私と直接お話されることをお勧めします。少なくとも一年以上一緒にやっていくことになりますので、希望する内容の研究ができそうか、教員と相性が合うかを確認しておくとよいと思います。 大学院への進学志望も大歓迎です。
狩野研究室で卒業研究(研究室配属)をしたい場合は、「静岡大学 情報学部 行動情報学科」を受験してください。研究室配属は行動情報学科の学生が主になります。
卒業生の主な就職先は以下の通りです。
アクセンチュア株式会社, 株式会社NTTドコモ, 株式会社オプト, 株式会社共同通信社, 株式会社サイバーエージェント, チームラボ株式会社, 株式会社トヨタシステムズ, スズキ株式会社,
日本アイ・ビー・エム(IBM), 日本電信電話株式会社(NTT), 富士ゼロックス株式会社, 富士通株式会社, ヤフー株式会社, 株式会社リクルート
等
詳細は以下のとおりです。
発表した論文は以下のとおりです。
AIWolfDial2024のメインページはこちら
https://sites.google.com/view/aiwolfdial2024-inlg
発表された論文一覧はこちら
https://aclanthology.org/events/aiwolfdial-2024/
おめでとうございます!!
DEIM2024のメインページはこちら
https://confit.atlas.jp/guide/event/deim2024/top
DEIM2024の表彰者一覧は こちら
発表した論文は以下のとおりです。
人工知能学会全国大会のメインページはこちら
https://www.ai-gakkai.or.jp/jsai2024/
発表した論文は以下のとおりです。狩野の共著論文も発表されました。
NLP2024の大会メインページはこちら
https://www.anlp.jp/nlp2024/
仲田君(B4)が、国際会議NTCIR-17のQA Lab for Political Information-4 (“QA Lab-PoliInfo-4”) Stance
Classification subtaskで首位の性能を達成しました。
またその発表において、Best Oral Presentation AwardとBest Poster Presentation Award を同時受賞しました。
おめでとうございます!!!
〒432-8011 静岡県浜松市中区城北3-5-1 情報学部2号館
静岡大学情報学部行動情報学科 狩野芳伸研究室
狩野准教授の連絡先は kano@inf.shizuoka.ac.jp です(全角@を半角@に変えてください)
Copyright © 2017 Kano Laboratory