「翻訳一般やわが町・千住について」
[書評] Machine Translation
2020 年 08 月 12 日
数式嫌いの翻訳者でもわかる機械翻訳の歴史
~MTの開発史の概略と今後の方向性~
書名:Machine Translation (The MIT Press Essential Knowledge Series)
著者:Tierry Poibeau(ティエリ・ポワボー)
出版社:The MIT Press
出版年:2017
ISBN:978-0262534215(ペーパーバック)
ページ数:296(ペーパーバック)、1107 KB(Kindle)
参考価格(amazon.co.jp):\1877(ペーパーバック)、\1780(Kindle)
私はMTを使っているが詳しくは知らない翻訳者で、ポストエディットの仕事を実際に受注している。MTの知識を深めたいと感じており、MTを使うと人手翻訳にどんな付加価値を提供できるかに興味がある。ただ、今まで目に触れたMTの関する本には数式が多く、それに大きな抵抗があった。
本書はMIT Pressの小型本、Essential Knowledge Seriesの1冊である。このシリーズではクラウドソーシングから持続可能性まで、主に技術的なトピックが簡潔に解説されている。
著者のティエリ・ポワボーはフランス国立科学研究センター(CNRS)のディレクターで、センター傘下の言語・認知科学の研究機関LATTICEの副代表でもある。自然言語の他、認知科学、言語習得、言語学の歴史に興味を持ち、関連分野で多くの論文を発表している。
第二次世界大戦以降の機械翻訳(以降「MT」と略す)の進展を概観することが本書の目的だが、数式や技術的な詳細をほとんど使わないことが特に意識されている。読者対象はMTに興味がある翻訳者や一般読者であり、MTを研究開発している技術者ではない。本書には数式がほとんどないことが購入の動機だったが、本書を読んでMTの概要に関してある程度の知識は得られたと感じている。
本書の構成はMT研究開発の時間軸にほぼ沿っている。「翻訳」の意味、MT開発史の概観、コンピュータ出現以前の状況を説明している最初の3章はMTにあまり興味がなくても役立つ内容だろう。以降、コンピュータを利用したMT研究の端緒となったルールベース、ALPACレポート、バイリンガルテキストの増大と並列コーパス、日本発祥のサンプルベース、統計ベース、セグメントベース、統計ベースの課題と制約、AIを使ったMT(ニューラルMT)といったMTの主要な技法の説明があり、MTの評価方法、市場分析に続いて、MTの今後の動向で締めくくられている。本書では随所に重要な文が1ページを割いて大きく書かれており、これは一般に学術書には見られない工夫である。
本書を読むまではMTについて誤解していたことが多かった。Google Translateの出現で実用性に注目が集まるようになるまでは「笑いのネタ」としか考えていなかった。つまり"Time flies like an arrow"のような文を例に、MTは役に立たないと考えていた。また、意味、知識、文脈といった、MTにとって厄介な要素がどのように扱われていたかよくわからなかった。さらに、MTにとっての暗黒時代といわれる時期(60年代半ばから90年)は本当に研究が滞っていたと思っていた。
これらの誤解が本書を読んで少し解けた。2016年以前の技法でも、用途が特化されてはいるものの、十分実用に耐えるシステム(たとえばカナダの天気予報の英・仏翻訳)があったそうだ。また、意味は言語学でも扱いが難しく、それゆえMTに組み込むのが難しい。さらに、60年代にMT研究が滞っていたのは主にアメリカで、その間も他国では研究が続けられていたことがわかった。
2017年に出版されたためGoogle Translateに端を発したニューラルMTの動向については大きく取り上げられていない。今後はMTの動向についてより詳細に解説している本や雑誌記事などで、MTに関する理解を深めていきたいと思った。また、最終章で取り上げられている自動同時通訳についても動向を追っていきたい。
人間の脳は解明されていない部分がまだ多く、「ニューラル」MTといってもそのプロセスは翻訳者が翻訳する場合とは異なる。将来、人間の翻訳プロセスが解明されて「ニューラル」MTが人間と同様のプロセスで翻訳するようになったら、MTは翻訳者のよき助手となるのか、それとも翻訳者を駆逐するのか。この疑問について、本書はこう答えている。
"Automatic systems will, of course, not replace human
translation--this is neither a goal nor a desired outcome
--but they will help millions of people have access to
information they could not grap otherwise." (p. 255)
「自動翻訳システムは、もちろん人間の翻訳に取って代わる
ものではありませんが、何百万人もの人々が、他の方法では
得られなかった情報にアクセスできるようになります。」
(DeepLによる翻訳 [訳抜けに注目])
MTは翻訳者が多い言語に対してではなく、翻訳者が少ない言語に対してこそ価値があるのだ。
●本書は2020年9月に森北出版より和訳が出版されます。
(著者名が「ポイボー」になっていますが、正しくは「ポワボー」です。)
https://www.morikita.co.jp/books/book/3455
~MTの開発史の概略と今後の方向性~
書名:Machine Translation (The MIT Press Essential Knowledge Series)
著者:Tierry Poibeau(ティエリ・ポワボー)
出版社:The MIT Press
出版年:2017
ISBN:978-0262534215(ペーパーバック)
ページ数:296(ペーパーバック)、1107 KB(Kindle)
参考価格(amazon.co.jp):\1877(ペーパーバック)、\1780(Kindle)
私はMTを使っているが詳しくは知らない翻訳者で、ポストエディットの仕事を実際に受注している。MTの知識を深めたいと感じており、MTを使うと人手翻訳にどんな付加価値を提供できるかに興味がある。ただ、今まで目に触れたMTの関する本には数式が多く、それに大きな抵抗があった。
本書はMIT Pressの小型本、Essential Knowledge Seriesの1冊である。このシリーズではクラウドソーシングから持続可能性まで、主に技術的なトピックが簡潔に解説されている。
著者のティエリ・ポワボーはフランス国立科学研究センター(CNRS)のディレクターで、センター傘下の言語・認知科学の研究機関LATTICEの副代表でもある。自然言語の他、認知科学、言語習得、言語学の歴史に興味を持ち、関連分野で多くの論文を発表している。
第二次世界大戦以降の機械翻訳(以降「MT」と略す)の進展を概観することが本書の目的だが、数式や技術的な詳細をほとんど使わないことが特に意識されている。読者対象はMTに興味がある翻訳者や一般読者であり、MTを研究開発している技術者ではない。本書には数式がほとんどないことが購入の動機だったが、本書を読んでMTの概要に関してある程度の知識は得られたと感じている。
本書の構成はMT研究開発の時間軸にほぼ沿っている。「翻訳」の意味、MT開発史の概観、コンピュータ出現以前の状況を説明している最初の3章はMTにあまり興味がなくても役立つ内容だろう。以降、コンピュータを利用したMT研究の端緒となったルールベース、ALPACレポート、バイリンガルテキストの増大と並列コーパス、日本発祥のサンプルベース、統計ベース、セグメントベース、統計ベースの課題と制約、AIを使ったMT(ニューラルMT)といったMTの主要な技法の説明があり、MTの評価方法、市場分析に続いて、MTの今後の動向で締めくくられている。本書では随所に重要な文が1ページを割いて大きく書かれており、これは一般に学術書には見られない工夫である。
本書を読むまではMTについて誤解していたことが多かった。Google Translateの出現で実用性に注目が集まるようになるまでは「笑いのネタ」としか考えていなかった。つまり"Time flies like an arrow"のような文を例に、MTは役に立たないと考えていた。また、意味、知識、文脈といった、MTにとって厄介な要素がどのように扱われていたかよくわからなかった。さらに、MTにとっての暗黒時代といわれる時期(60年代半ばから90年)は本当に研究が滞っていたと思っていた。
これらの誤解が本書を読んで少し解けた。2016年以前の技法でも、用途が特化されてはいるものの、十分実用に耐えるシステム(たとえばカナダの天気予報の英・仏翻訳)があったそうだ。また、意味は言語学でも扱いが難しく、それゆえMTに組み込むのが難しい。さらに、60年代にMT研究が滞っていたのは主にアメリカで、その間も他国では研究が続けられていたことがわかった。
2017年に出版されたためGoogle Translateに端を発したニューラルMTの動向については大きく取り上げられていない。今後はMTの動向についてより詳細に解説している本や雑誌記事などで、MTに関する理解を深めていきたいと思った。また、最終章で取り上げられている自動同時通訳についても動向を追っていきたい。
人間の脳は解明されていない部分がまだ多く、「ニューラル」MTといってもそのプロセスは翻訳者が翻訳する場合とは異なる。将来、人間の翻訳プロセスが解明されて「ニューラル」MTが人間と同様のプロセスで翻訳するようになったら、MTは翻訳者のよき助手となるのか、それとも翻訳者を駆逐するのか。この疑問について、本書はこう答えている。
"Automatic systems will, of course, not replace human
translation--this is neither a goal nor a desired outcome
--but they will help millions of people have access to
information they could not grap otherwise." (p. 255)
「自動翻訳システムは、もちろん人間の翻訳に取って代わる
ものではありませんが、何百万人もの人々が、他の方法では
得られなかった情報にアクセスできるようになります。」
(DeepLによる翻訳 [訳抜けに注目])
MTは翻訳者が多い言語に対してではなく、翻訳者が少ない言語に対してこそ価値があるのだ。
●本書は2020年9月に森北出版より和訳が出版されます。
(著者名が「ポイボー」になっていますが、正しくは「ポワボー」です。)
https://www.morikita.co.jp/books/book/3455