逐語訳のサンプル
「TRTEXT」は「完全な翻訳文」を提供するものではありません。
オリジナルの文章(英語、インドネシア語、etc.)に対して、「訳語」の「候補」を所定の「辞書」から選び出して表示するソフトです。
例:
次のインドネシア語を記述したテキスト・ファイルをTRTEXTで処理したとしましょう。
TRTEXT用の「インドネシア語−日本語辞書」を用意した上で操作すると、次のような内容のテキスト・ファイルを生成します。
※注意:上の画面で表示させている日本語訳は正しくない可能性があります。鵜呑みにしないようにしてください。インドネシア語−日本語の辞書は随時更新されていますが、残念ながら正確な記述を保証するものではありません。
解説:
- 用意された辞書に訳語が登録されている場合、その訳語を原語の下に記述します。
- 2つ以上の単語を組み合わせた熟語については、辞書に登録されてれば、「++>」という表記で訳語を併記します。
上の例では、「surat kabar(新聞)」「Amerika Serikat(アメリカ合衆国)」です。 - ある単語に前接辞・後接辞が付く場合、辞書にその単語が登録されていれば、「前接辞_訳語」「訳語_後接辞」という形で表記します。上の例では、「sebanyak(seとbanyak)」「diterbangkan(menerbangkanの受動態)」「diasuh(asuhの受動態)」が該当します。後接辞の場合、上の例に登場しませんが、「_nya」などに対応しています。
※残念ながら、前接辞と後接辞が同時に付くケースには対応してません。例:menginformasikan(meng+informasi+kan) informasi(情報)を他動詞化したもの。「知らせる」といった意味になる。このような単語が文中に登場した場合、「meng_情報_kan」と訳文を出力したいのですが、現状では対応していません。
▼▼▼2005/03/23 訂正▼▼▼
「前接辞・後接辞が同時に付く場合には対応してない」などと書いてしまいましたが、対応していました。作者に問い合わせたところ、親切にも教えていただきました。感謝であります。
ただし、オプション・スィッチで「X1」を指定する必要があります。現在、いろいろな文章(単語)を処理させて、チューニング中。もう暫くしたら、更新版として辞書ファイルを公開すると共にオプションの設定方法を記載ページを作成します。
▲▲▲2005/01/23 訂正▲▲▲
下記「2005/04/26 インドネシア語−日本語辞書Ver.1.5による強化」をご覧ください。 - 当然のことながら、辞書に登録されていない単語については、訳語の候補を表示できません。原文のまま一行下に表記します。上の例では「The Washington post」「WorldHelp」が該当します。
- ▼▼▼2005/01/26 インドネシア語−日本語辞書Ver.1.4による強化▼▼▼
動詞の短縮表記対応:文頭に「me-, mem-, men-, meny-, memper-」などが付く動詞の短縮表記が文章にある場合、訳語の候補としてヒットするようにしました。
【例】
Laskar JihadTinggalkanBogor Menuju Yogyakarta.
上の文章にある「tinggalkan」は、よく新聞の見出しに出てくる単語です。正式な綴りは「meninggalkan」([去る/離れる]の意味)のはずですが、tinggalkanと表記されることが多い。
こういった表記に対して、正式な綴りの候補が辞書の中にあれば、次のように訳語の候補を出力するように設定しました。
>>Tinggalkan
>>(meni~省)_~を去る/離れる <−「~省」は[省略]という意味の補足として出力。
【解説】
辞書ファイル内に、meninggalkanは登録されているが、tinggalkan がない場合、上記のように出力します。当然のことながら tinggalkan が辞書に登録されていれば、辞書内で「tinggalkan」に記述されている訳語を候補として出力しますが、こういった登録自体、あまり意味がないことでしょう。
なお、上の文章の意味としては『ラスカルジハード、ボゴールを離れジョグジャカルタへ向かう』といったところです。
インドネシア語初心者としては、「tinggalkan」のような表記を真正直に辞書で探してしまい、手間となること多い。(tinggalkanという単語は、まず辞書には載っていないでしょう)
▲▲▲2005/01/26 インドネシア語−日本語辞書Ver.1.4による強化▲▲▲ - ▼▼▼2005/04/26 インドネシア語−日本語辞書Ver.1.5による強化▼▼▼
前接辞・後接辞の両方が同時に付いた変化に対応できるようにしています。
【例1】
>>mengabolisikan
>>meng_廃止_kan
「abolisi」に、meng及びkanが付いた変化。他動詞化させる変化です。辞書に「abolisi」(廃止)が登録されていれば、上のように出力します。もちろん、「mengabolisikan」そのものが辞書に登録されていれば、そちらの意味を優先して出力します。
【例2】
また、後接辞として「kan」の代わりに「in」が付く変化(特殊なもの。ジャカルタの若者言葉に多い模様)に対応しました。
>>lanjutin
>>(me~省)_継続する/続ける_(in<-kan代)
原型は「melanjutkan」。me-語根-kan動詞の前接辞「me」を省略し、後接辞「kan」の代わりに「in」をくっ付けたもの。
若手歌手のインタビュー記事を読んでいると、よく登場する変化でしたので、対応させることとしました。
辞書に対応するme-語根-kan動詞が登録されていれば、上のように出力します。
【欠点】
今回の変更で、残念ながら次のように出力される場合があります。
>>dikeluarkan
>>di_ke_外/外部_kan
辞書に「mengeluarkan」が登録されている場合であっても、上のように完全にバラバラに単語を分解してしまいます。
本来は次のように出力させたいのですが。。。
>>dikeluarkan
>>(meng~受)_(費用を)出す
また、次のように前接辞「me」を繰り返して出力するケースもあります。
>>naiknya
>>(me~省)_me_乗る/登る_nya
このあたりについては、文法ファイル「INE.SYN」の記述を検討すれば、避けることができるかもしれませんが、今のところ対応できていません。
なお、TRTEXT を利用する際に「-X0」というオプションスイッチを付ければ、前接辞・後接辞の何れかに対応するモードとなり、上のような出力は避けることができます。
▲▲▲2005/04/26 インドネシア語−日本語辞書Ver.1.5による強化▲▲▲
翻訳にあたっての制限事項:
- TRTEXTは上のような具合に作動しますので、出力された「訳語付きのテキスト」を理解するには対象となる言語の文法知識が不可欠になります。
- また、辞書の中で一つの単語に対し長い説明を付けることも実質的にできません。もちろん、実際には長い説明を辞書で記述しても作動しますが、用意された記述全てを訳文で表示させてしまいますので、出力される訳文内が見難い状態となるでしょう。
どんなユーザー向けか?
- 上のような結果から、単純に「日本語訳」が欲しい人にはお勧めできません。「日本語に訳された文章(日本語の文章)」は上のような出力ファイルを元に、ユーザー各自が作文することになります。
- TRTEXTは、文法の知識が不可欠ですし、不十分な訳語候補の中から適切な意味を読み取る努力も必要です。こういった状態ですので、対象となる言語の学習者向けと言えるのではないでしょうか。
ところで、誤解のないように!チャンと勉強したい人は先生に付いて学習してください。キチンとした辞書も必要です。TRTEXT用の辞書だけで大丈夫などとは決して思わないでください。 - さて、上のインドネシア語の大意は『300人ものアチェの子供が、WorldHelpという宣教師グループによって養育されるため、ジャカルタへ飛行機で移されるとアメリカの新聞The Washington Postが報じた云々』といったところだと思います。正確な逐語訳はご容赦ください。上の文章だと最初の「Pernyataan ini menanggapi」が上手く訳せないので。
上のような諸条件を踏まえた上で、TRTEXTを使ってみようと思う方は次のページ「
Windowsでの設定
」へお進みください。