「駆け出しの翻訳屋」として、学習したことをちょこちょこ書くつもりでしたが、「いつまで駆け出しなんだ?!」と言っているうちに早、リタイア年齢に!
現在は、城めぐり、乗り鉄などの旅と読書の話がメインです。
修了作品の続きを翻訳するにあたり、翻訳ツールを OmegaT から Trados 2011 に移行することにしました。
OmegaT は気に入っているのですが、Word の数式の扱いに問題があるためです。
<2013.10.28 追記>
「Word の数式の扱いに問題」という件、私の勘違いで、別のエラーかもしれません。
後で試したら、再現しなかった箇所がありました)。
というわけで、OmegaT から Trados 2011 へのお引っ越しについてまとめました。
1. 翻訳メモリのインポート
OmegaT には翻訳メモリが3種類ありますが、Trados 2011 にエクスポートするのはタグ情報なしの翻訳メモリにします。
つまり、(プロジェクト名)-level1.tmx というファイルです。
Trados 2011へのインポートは簡単でした。
あらかじめ、Trados 2011 で翻訳メモリを作成しておき、そのメモリを選択して、[ファイル]-[インポート] をクリックします。
次に、[インポート] ウィンドウで、[ファイルの追加] をクリックして、インポートする翻訳メモリを選択します。
あとは、ウィザードに従うだけです。
2. 用語集のインポート
用語集はちょっとだけ手間がかかります。
1) OmegaT の用語集の変換
OmegaT の用語集(タブ区切りの TXT ファイル)を開き、先頭に見出しの行
English<tab>Japanese
を追加します。
文字コードをShiftJISに変更して、別名で保存します。
2) MultiTerm Convert で上記の用語集を変換
まず、[スタート] メニューから [SDL MultiTerm 2011 Convert] を起動します。
次に、ウィザードに従って、次のように設定します。
・[新規変換セッション] を選択して [次へ] をクリック。
・[スプレッドシートまたはデータベース交換形式] を選択して、[次へ] をクリック。
・入力ファイルに、上記でShiftJISに変更した用語集のファイルを選択して設定。
その他の項目は自動で入ったものをそのままとする。[次へ] をクリック。
・区切り文字が [タブ] になっていて、[データプレビュー] が正しく表示されていることを確認して、[次へ]をクリック。
・[見出しフィールド] の [English] を選択して、[インデックス フィールド] の [English (United Staes)]を 選択。
同様に [Japanese] を選択して、[インデックス フィールド] の [Japanese] を選択。
[次へ] をクリック。
・エントリ構造はそのままにして [次へ] をクリック。
・以下、ウィザードに従って [次へ] をクリック。
3) MultiTerm用語ベースにインポート
まず、MultiTerm Desktop を起動し、用語ベースを作成します。
・[用語ベース] - [用語ベースの作成] を選択。
・[既存の用語ベース定義ファイルを読み込み] を選択し、2)の変換でできた.xdtファイルを選択。[次へ]をクリック。
・用語ベースの表示名を設定し、[次へ] をクリック。
・インデックスフィールドに [English] と [Japanese] が表示されていることを確認し、[次へ] をクリック。
・以下、ウィザードに従って [次へ] をクリック。
次に、作成した用語ベースに2)の用語集をインポートします。
・[カタログ] ビューを開く。
・[Import] をクリック。
・[Default import definition] を選択。
・[カタログ] - [実行] をクリック。
・[インポート ファイル] に2)の変換でできた.xmlファイルを指定して、[次へ] をクリック。
・[除外ファイル] に適当なファイル名を設定して、[次へ] をクリック。
・以下、ウィザードに従って [次へ] をクリック。
OmegaT は気に入っているのですが、Word の数式の扱いに問題があるためです。
<2013.10.28 追記>
「Word の数式の扱いに問題」という件、私の勘違いで、別のエラーかもしれません。
後で試したら、再現しなかった箇所がありました)。
というわけで、OmegaT から Trados 2011 へのお引っ越しについてまとめました。
1. 翻訳メモリのインポート
OmegaT には翻訳メモリが3種類ありますが、Trados 2011 にエクスポートするのはタグ情報なしの翻訳メモリにします。
つまり、(プロジェクト名)-level1.tmx というファイルです。
Trados 2011へのインポートは簡単でした。
あらかじめ、Trados 2011 で翻訳メモリを作成しておき、そのメモリを選択して、[ファイル]-[インポート] をクリックします。
2. 用語集のインポート
用語集はちょっとだけ手間がかかります。
1) OmegaT の用語集の変換
OmegaT の用語集(タブ区切りの TXT ファイル)を開き、先頭に見出しの行
English<tab>Japanese
を追加します。
文字コードをShiftJISに変更して、別名で保存します。
2) MultiTerm Convert で上記の用語集を変換
まず、[スタート] メニューから [SDL MultiTerm 2011 Convert] を起動します。
・[新規変換セッション] を選択して [次へ] をクリック。
・[スプレッドシートまたはデータベース交換形式] を選択して、[次へ] をクリック。
・入力ファイルに、上記でShiftJISに変更した用語集のファイルを選択して設定。
その他の項目は自動で入ったものをそのままとする。[次へ] をクリック。
・区切り文字が [タブ] になっていて、[データプレビュー] が正しく表示されていることを確認して、[次へ]をクリック。
・[見出しフィールド] の [English] を選択して、[インデックス フィールド] の [English (United Staes)]を 選択。
同様に [Japanese] を選択して、[インデックス フィールド] の [Japanese] を選択。
[次へ] をクリック。
・エントリ構造はそのままにして [次へ] をクリック。
・以下、ウィザードに従って [次へ] をクリック。
3) MultiTerm用語ベースにインポート
まず、MultiTerm Desktop を起動し、用語ベースを作成します。
・[用語ベース] - [用語ベースの作成] を選択。
・[既存の用語ベース定義ファイルを読み込み] を選択し、2)の変換でできた.xdtファイルを選択。[次へ]をクリック。
・用語ベースの表示名を設定し、[次へ] をクリック。
・インデックスフィールドに [English] と [Japanese] が表示されていることを確認し、[次へ] をクリック。
・以下、ウィザードに従って [次へ] をクリック。
次に、作成した用語ベースに2)の用語集をインポートします。
・[カタログ] ビューを開く。
・[Default import definition] を選択。
・[カタログ] - [実行] をクリック。
・[インポート ファイル] に2)の変換でできた.xmlファイルを指定して、[次へ] をクリック。
・[除外ファイル] に適当なファイル名を設定して、[次へ] をクリック。
・以下、ウィザードに従って [次へ] をクリック。
PR
#今日のテーマは、PDF の透明テキストを削除し、テキスト認識 をやり直す方法です。
修了作品は終わったのですが、実は 1 冊全部を訳したわけではなく、付録部分が残っています。
選択した原著のページ数があまりに多かったので、付録を除く本文のみを修了作品としたのです。
で、、、残りの部分はもういいや、、、と思っていたのですが、せっかくなので、隙間時間にコツコツ訳してみようと思いました。^o^
で、まずは原著の取り込み (スキャン & OCR) からです。
何せ、前回原著の取り込みをしたのは半年以上前のことなので、かなり忘れていました。^^;
しかも、前回、Acrobat の OCR を使ったのですが、その Acrobat をバージョンアップしてしまったため、メニューがわからず、少々とまどいました。
その Acrobat の OCR なのですが、前回はスキャナについていた OCR より Acrobat の OCR の方が良いと思っていたのですが、今回使って見ると、結構、誤認識があります。
英語を指定しているのに、なぜか「th」が「出」と認識されているケースが多いです。;_;
ちょっと調べてみたところ、Acrobat の OCR で「ClearScan」という方式を選択した方が良かったのでは? という気がしました。
ですが、OCR の後、PDF を上書きしてしまったので、認識したテキストデータを削除しないと、OCR をやり直すことができません!
というわけで、認識したテキストデータ (一般に「透明テキスト」と呼ばれるらしいです) を削除して、ClearScan でテキスト認識をやり直しました。
ステップ1:失敗した OCR テキストの削除
1) [ツール] - [保護] - [非表示情報を検索して削除]をクリック
2) 検索が完了したら、[非表示テキスト] を選択して削除
これで、認識したテキストデータが削除されました。
ステップ2: テキスト認識
1) [ツール] - [テキスト認識] で、[このファイル内] を選択
2) [テキスト認識] のポップアップウィンドウで、[編集] をクリック
3) [PDFの出力形式] というプルダウンメニューで、[ClearScan]を選択
4) [OK] をクリック
これで、テキスト認識し直したところ、同じデータなのに誤認識が格段に減りました。
もしかしたら、前回も ClearScan を使ったのかなぁ。。。^^;
修了作品は終わったのですが、実は 1 冊全部を訳したわけではなく、付録部分が残っています。
選択した原著のページ数があまりに多かったので、付録を除く本文のみを修了作品としたのです。
で、、、残りの部分はもういいや、、、と思っていたのですが、せっかくなので、隙間時間にコツコツ訳してみようと思いました。^o^
で、まずは原著の取り込み (スキャン & OCR) からです。
何せ、前回原著の取り込みをしたのは半年以上前のことなので、かなり忘れていました。^^;
しかも、前回、Acrobat の OCR を使ったのですが、その Acrobat をバージョンアップしてしまったため、メニューがわからず、少々とまどいました。
その Acrobat の OCR なのですが、前回はスキャナについていた OCR より Acrobat の OCR の方が良いと思っていたのですが、今回使って見ると、結構、誤認識があります。
英語を指定しているのに、なぜか「th」が「出」と認識されているケースが多いです。;_;
ちょっと調べてみたところ、Acrobat の OCR で「ClearScan」という方式を選択した方が良かったのでは? という気がしました。
ですが、OCR の後、PDF を上書きしてしまったので、認識したテキストデータを削除しないと、OCR をやり直すことができません!
というわけで、認識したテキストデータ (一般に「透明テキスト」と呼ばれるらしいです) を削除して、ClearScan でテキスト認識をやり直しました。
ステップ1:失敗した OCR テキストの削除
1) [ツール] - [保護] - [非表示情報を検索して削除]をクリック
2) 検索が完了したら、[非表示テキスト] を選択して削除
これで、認識したテキストデータが削除されました。
ステップ2: テキスト認識
1) [ツール] - [テキスト認識] で、[このファイル内] を選択
2) [テキスト認識] のポップアップウィンドウで、[編集] をクリック
3) [PDFの出力形式] というプルダウンメニューで、[ClearScan]を選択
4) [OK] をクリック
これで、テキスト認識し直したところ、同じデータなのに誤認識が格段に減りました。
もしかしたら、前回も ClearScan を使ったのかなぁ。。。^^;
iPhone を買って、うれしがっていたのはいいけれど、早速、仕事の依頼を逃してしまいました。-.-;
仕事のメールは携帯メールにも転送するようにしていたのですが、iPhone にしたら、携帯メールがプッシュ通知に対応していないので、Gmail を使おうか、iCloud を使おうか、などといろいろ考えて設定し、ちゃんと PC メールも使えるように設定して出掛けたつもりが、、、大失敗。;_;
転送できることは確認していたのですが、フィルタリング設定は以前と同じなので、あまり気にしていませんでした。そう、すべてのメールを携帯に転送すると面倒なので、送信者でフィルタリングして転送するようにしているのですが、転送先を修正したときに、なぜか、
・転送設定では、フィルタリングを適用する
・フィルタリング設定では、この転送先には適用しない
という矛盾した状態になってしまっていて、結局、転送されませんでした。;_;
そもそも18時を過ぎた時点で、今日はもう連絡が来ることはないだろうと油断していたので、携帯が鳴っても気づかない状態だったんですけどね。(←ま、この時点でアウトですね。^^;)
PC メールにアクセスして気づきましたが、そのときにはすでに依頼がキャンセルされていました。-.-;
その上、謝罪メールを送ろうとしたら、PC メールも受信できるのに送信できない状態でした (とほほ ;_;)。
緊急の仕事だったので、どっちみち引き受けられなかったのですが、連絡がつかなかったのはマズイですよね。
一応、18時以降は反応が遅くなりますと言ってあるのですが、やはり常に携帯には出られるようにしないといけないということですね。
家にいるときは、家事をしているときも携帯を常にそばにおいているのですが、人に会うときはさすがに手元に置いておくというのもどうかと思うのですが。。。
-いっそ、18時で営業終了としてしまう?
いやいや、駆け出しの翻訳屋がそんなことしてられませんよね。^_^;
どうにも出られないときだけ、「○時まで不在です」と自動返信するように設定するか、ですね。
会社員時代に、そういうメールが返ってきたことがあるのですが、そういう設定ができるのでしょうか。。。
仕事のメールは携帯メールにも転送するようにしていたのですが、iPhone にしたら、携帯メールがプッシュ通知に対応していないので、Gmail を使おうか、iCloud を使おうか、などといろいろ考えて設定し、ちゃんと PC メールも使えるように設定して出掛けたつもりが、、、大失敗。;_;
転送できることは確認していたのですが、フィルタリング設定は以前と同じなので、あまり気にしていませんでした。そう、すべてのメールを携帯に転送すると面倒なので、送信者でフィルタリングして転送するようにしているのですが、転送先を修正したときに、なぜか、
・転送設定では、フィルタリングを適用する
・フィルタリング設定では、この転送先には適用しない
という矛盾した状態になってしまっていて、結局、転送されませんでした。;_;
そもそも18時を過ぎた時点で、今日はもう連絡が来ることはないだろうと油断していたので、携帯が鳴っても気づかない状態だったんですけどね。(←ま、この時点でアウトですね。^^;)
PC メールにアクセスして気づきましたが、そのときにはすでに依頼がキャンセルされていました。-.-;
その上、謝罪メールを送ろうとしたら、PC メールも受信できるのに送信できない状態でした (とほほ ;_;)。
緊急の仕事だったので、どっちみち引き受けられなかったのですが、連絡がつかなかったのはマズイですよね。
一応、18時以降は反応が遅くなりますと言ってあるのですが、やはり常に携帯には出られるようにしないといけないということですね。
家にいるときは、家事をしているときも携帯を常にそばにおいているのですが、人に会うときはさすがに手元に置いておくというのもどうかと思うのですが。。。
-いっそ、18時で営業終了としてしまう?
いやいや、駆け出しの翻訳屋がそんなことしてられませんよね。^_^;
どうにも出られないときだけ、「○時まで不在です」と自動返信するように設定するか、ですね。
会社員時代に、そういうメールが返ってきたことがあるのですが、そういう設定ができるのでしょうか。。。
カレンダー
| 05 | 2026/06 | 07 |
| S | M | T | W | T | F | S |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
カテゴリー
プロフィール
HN:
明風
性別:
非公開
自己紹介:
某社の技術職からフリーランスのIT翻訳屋に転身。
「駆け出しの翻訳屋」と言っているうちに、早、リタイア年齢に!
現在は、読書、城めぐり、乗り鉄などの趣味に明け暮れています。
「駆け出しの翻訳屋」と言っているうちに、早、リタイア年齢に!
現在は、読書、城めぐり、乗り鉄などの趣味に明け暮れています。
最新記事
(05/18)
(05/03)
(05/01)
(04/17)
(03/10)
ブログ内検索
P R
忍者AdMax
フリーエリア

