概要
QRidiomはオンライン翻訳者支援システムの構築を行っている椎茸プロジェクトの一部であり, 入力された英文に対して存在する可能性のあるイディオム(熟語・慣用句)を検索, 表示するツールである. 現在はQRidiomのインタフェース部分の構築を行っている. これは翻訳者に対しある程度幅を持たせた出力を与えるためのもので, 翻訳者は出力する知識・情報を変更することが可能となる.
メンバー
竹内孔一
手塚裕一(2009年度卒業)
蛭濱康雄(2007年度卒業)
金平昂(2006年度卒業)
平尾一樹(2006年度卒業)
東京大学影浦研究室
背景
翻訳を行う際の問題の一つにイディオムの存在が挙げられる. イディオムはテキスト中に様々な形で出現するため, 翻訳者にとって未知のイディオムは大きな障害となる. 我々はまずこのイディオムを整理し,4つに分類した.
その分類は①挿入(kick the bucket 意味:自殺する → kick the big bucket)・②置換(head screwed on right → head screwed on wrong)・③削除(not get to first base → got to first base)・④主題化(break the ice 意味:雰囲気を和らげる → the ice is broken)である.
すでに存在する辞書を用いて翻訳者に対しこれらのイディオムの情報(訳や位置情報など)を提示出来れば翻訳作業の高速化や負担の軽減に繋がる.
研究内容
QRidiomは英文テキストを入力とし, そのテキスト中に存在する可能性のあるイディオムの表層と位置情報を出力する. 背景でも述べたようにイディオムには様々な異形が存在する. そこでQRidiomをこれらの異形に対応する研究を行った. 異形イディオムのうち, 挿入・置換・削除は辞書に現れる形とテキスト中の形が異なり, 主題化は辞書中の語順とテキストに現れる語順が異なる.そこで挿入・置換・削除と主題化それぞれに異なる処理を加え, 不要な候補や取りこぼしがないよう工夫した.
現在は翻訳者に合わせたQRidiomインタフェースを作成に取り組んでいる. これはプログラミング等の技術的な知識に乏しくてもシステムの出力を変更しシステムをより使いやすくする.
論文
- 竹内孔一, 金平昂, 平尾一樹, 阿辺川武, 影浦峡: 置換・挿入を考慮した異形イディオム検索システムの構築, 言語処理学会第13 回年次大会発表論文集, pp. 396.399(2007).
- 蛭浜康雄,金平昂, 平尾一樹, 竹内孔一, 阿辺川武,影浦峡: WordNet と同音異義語を利用した異形イディオム検索,言語処理学会第14 回年次大会発表論文集, pp. 1045.1048(2008).
デモ
QRidiomは「みんなの翻訳」中の編集ツールQRedit内に組み込まれているのでこちらを参照してください.