TCU Research Directory 2023
220/326

岩イワノ野 公コウジ司教授複数スマートフォン環境における会話音声の知的処理音声認識 / 話者認識 / 音楽情報処理 / 画像認識研究テーマキーワードメディア情報学部 情報システム学科岩野研究室(音メディア処理)研究室HP最近の研究テーマ研究内容と目指すもの音声・音楽・環境音・映像など、『音』を中心としたマルチメディア情報を対象として、それらを知的に処理・認識・理解する情報システムの研究を行っています。特に、音声認識や話者認外部資金• 基盤研究(B)「マルチエージェント深層学習による音声因子分解」(研究分担者:R1-R3)• 基盤研究(C)「声真似による成りすまし攻撃に対する話者照合の耐性向上に関する研究」(研究代表者:R1-R3)• 基盤研究(B)「深層学習によるマルチモーダル時系列データ認識基盤の構築」(研究分担者:H28-H30)研究者情報「様々な場所で繰り広げられる会話について、参加者の各自のスマートフォンで音声を収録し、そのデータをクラウド上に送信して処理することで、議事録など様々な情報への加工を行う」といった未来の音声情報システムの実現を目指し、それに必要となる「誰と誰が会話を行っているか」「誰がいつしゃべっているか」といった情報の推定・抽出技術の開発を行っています。218 TCU Research Directory 2023識、音楽認識、画像認識といったAI 技術に焦点をあて、これらを利用した、人や社会に役立つ知的情報システムの構築・実現を目指し、研究活動を展開します。• 基盤研究(C)「模倣音声による詐称攻撃に対して頑健な話者照合の研究」(研究代表者:H25-H28)• 基盤研究(B)「Deep Generative Model とその因子分解による音声情報処理基盤」(研究分担者:H25-H27)• 栢森情報科学振興財団研究助成「ウェアラブルコンピュータ環境における高精度話者照合に関する研究」(研究代表者:H20-H22)技術の特徴大量の音データから「誰と誰がグループとなって会話を行っているか」を抽出するグループ同定は、最適な音響特徴量の抽出とクラスタ分析により実現されます。「誰がいつしゃべっているか」の推定には、深層学習などで構築された話者モデルを利用します。技術の用途例えば、イベント会場などで様々な会話が繰り広げられているときに、「誰と誰がグループとなって、どのような話題の会話をしているか」といった情報を参加者に提供する「交流支援システム」などに、本技術の応用が期待されます。企業等との連携可能テーマ• 音声認識・話者認識・画像認識を利用した知的な情報処理システムの構築に関する研究• 音声による個人認証システムの実用化に関する研究• 知的な音楽情報処理システムの実現に関する研究知的財産権・関連論文情報・著書• 岩野公司編著、コロナ社、音響学講座7 音声(下)、2023• 岩野公司他、複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善、電子情報通信学会技術研究報告、査読無、Vol.116、No.189、2016、53-58

元のページ  ../index.html#220

このブックを見る