phi-4DeepSeek-R1の翻訳を比較してみました。

参考として、Chat-GPT4oとGoogle翻訳も一緒に挙げておきます。

ごく雑なことを言えば、これを見る限りではphi-4の方が使いやすいなという印象です。

元テキストについて

元テキストは、LMS7002というソフトウェアラジオのチップの計測データに関するドキュメントからの抜粋です。

LMS7002M_Measurements-v1_05.pdf

つまり、ハードウェアに関する説明ドキュメントです。

このような文書ですから、

  • 文体に感情はあまりない
  • 高度な文脈依存がない
  • 専門用語が多数ある

という性質を持っています。

ですから、一般の機械翻訳でも問題なく翻訳できるタイプの文書ではないかと思います。

プロンプトとしては、単純に「以下を日本語にして下さい」とだけ与えてあります。

例文1

原文

The VCOs and feedforward dividers determine the range of local oscillator (LO) frequencies that the LMS7002M synthesizer can generate. The highest LO frequency generated is limited by the highest frequency of VCOH. The lowest frequency generated is limited by the lowest frequency of VCOL and the maximum value of feedforward division (64). The three VCOs provide over an octave of coverage, ensuring the frequency range is continuous over the working range. The frequency ranges achievable with different VCO and feedforward divider settings are shown in Table 1.

DeepSeek-R1

<think>
</think>

VCO(Voltage-Controlled Oscillator)とフォードフィードバック・ディバイダーは、LMS7002M合成器が生成できるローカル・オシレーター(LO)周波数の範囲を決定します。生成される最高のLO周波数は、VCOHの最高周波数によって制限されます。生成される最低周波数は、VCOLの最低周波数とフォードフィードバック・ディバイダーの最大値(64)によって制限されます。3つのVCOは、オクターブを超える帯域をカバーし、作業範囲内で周波数帯域を連続的に保つことを保証します。異なるVCOとフォードフィードバック・ディバイダー設定での達成可能な周波数帯域は、表1に示されています。

「心の声」がありません。

原文にないVCOについての説明が補足されています。

synthesizerの訳が「合成器」となっているのはちょっと残念です。 カタカナ語の方が違和感なかったと思います。

phi-4

以下を日本語に翻訳します。

VCOおよびフィードフォワードディバイダは、LMS7002M合成器が生成できるローカルオシレータ(LO)周波数の範囲を決定します。生成される最高のLO周波数は、VCOHの最高周波数に制限されます。生成される最低周波数は、VCOLの最低周波数とフィードフォワード分周の最大値(64)によって制限されます。3つのVCOはオクターブ以上の範囲を提供し、動作範囲全体で周波数範囲が連続になることを保証します。異なるVCOとフィードフォワードディバイダの設定で達成可能な周波数範囲は、表1に示されています。

「以下を日本語に翻訳します。」ってあるのですが、意味が通りませんね。

それを除けば、ソツのない訳です。 synthesizerの訳が「合成器」となっているのはちょっと残念です。 カタカナ語の方が違和感なかったと思います。

ChatGPT-4o

VCO(電圧制御発振器)とフィードフォワード分周器は、LMS7002Mシンセサイザが生成可能なローカルオシレーター(LO)周波数の範囲を決定します。生成される最大のLO周波数は、VCOH(高周波用VCO)の最大周波数によって制限されます。一方、生成される最小の周波数は、VCOL(低周波用VCO)の最小周波数とフィードフォワード分周の最大値(64)によって制限されます。3つのVCOは1オクターブ以上の範囲をカバーし、動作範囲内で周波数範囲が連続することを確保しています。異なるVCOとフィードフォワード分周器の設定で実現可能な周波数範囲は、表1に示されています。

VCOの説明が日本語になってるのと、VCOHやVCOLの説明も追加されています。 とは言え、この文章だけからVCOHやVCOLがこの説明であると言えるかと言えば、何とも微妙です。 多分正しいとは思うのですが。

synthesizerの訳が「シンセサイザ」となっているのは良いのですが、ここの文では「のシンセサイザ」の方が良かったように思います。 実際そういった意味ですから。 文脈依存なので難しいのと、これでもわかる人はわかるので、まぁいいのかも知れません。

Google翻訳

VCO とフィードフォワード分周器は、LMS7002M シンセサイザが生成できる局部発振器 (LO) 周波数の範囲を決定します。生成される最高 LO 周波数は、VCOH の最高周波数によって制限されます。生成される最低周波数は、VCOL の最低周波数とフィードフォワード分周器の最大値 (64) によって制限されます。3 つの VCO は 1 オクターブ以上の範囲をカバーし、動作範囲全体で周波数範囲が連続していることを保証します。さまざまな VCO とフィードフォワード分周器の設定で実現可能な周波数範囲を表 1 に示します。

「local oscillator」を翻訳してくれました。 それ以外は「とにかく翻訳した」という感じです。

評価

どれもまぁいい感じなのではないでしょうか?

速度に関しては、LLMは「LLMの速度」ですが、Google翻訳は一瞬です。 単純な翻訳だと思えば、やっぱり翻訳は機械翻訳を素直に使うのが良いのかなという感じではあります。

とは言え、LLMは補足をしてくれたりするので、うまく当たればラッキーではあります。

例文2

原文

In the second region, the plateau region, phase noise is dominated by the charge pump noise (and noise from the crystal reference if its phase noise is above about -145dBc/Hz). The plateau region phase noise is measured with the phase noise personality of a Spectrum Analyzer as shown in Figure 5 which can measure accurately down to about -130dBc. The LMS7002M is configured as a transmitter with a DC input from the MXG (a low frequency single sideband input could also be used). Measurements of plateau region noise are presented in Figure 6 and Figure 7 for a number of different LO frequencies for two reference frequency sources. The first reference frequency is with a Rakon 30.72MHz commercial temperature stable crystal oscillator (TXCO). The second is for a discrete transistor very low phase noise 50MHz crystal reference. The integrated phase noise results are given in Table 3.

DeepSeek-R1

<think>
Alright, I need to translate the provided English text into Japanese. Let me read through it carefully to understand the context and technical terms involved.

The text discusses phase noise in two regions, focusing on the plateau region where phase noise is influenced by charge pump noise and potentially the crystal reference if its phase noise is above -145dBc/Hz. It mentions the use of a Spectrum Analyzer's phase noise personality for accurate measurements down to about -130dBc. The LMS7002M is configured as a transmitter with a DC input from the MXG, and alternative inputs are considered. Figures 6 and 7 present measurements for different LO frequencies with two reference frequencies: one using a Rakon 30.72MHz oscillator and the other a discrete transistor-based 50MHz crystal reference with very low phase noise. Table 3 summarizes the integrated phase noise results.

I need to ensure that technical terms like "phase noise," "charge pump noise," "crystal oscillator," and "Spectrum Analyzer" are accurately translated into Japanese. Also, I should maintain the clarity and structure of the information, such as the descriptions of figures and tables.

Let me start translating section by section, making sure to convey the precise meaning and maintain the technical accuracy.
</think>

2番目の地域、plateau地域では、フェーズ・ノイズは主にチャージ・ポンプ・ノイズ(及びクリスタル・リファレンスのフェーズ・ノイズが約-145dBc/Hzを超える場合のそのノイズ)によって支配されます。Plateau地域のフェーズ・ノイズは、スペクトラム・アナライザーのフェーズ・ノイズ特性を使用して正確に測定され、約-130dBcまで測定可能です。LMS70002Mは、MXGからのDC入力を持つ transmitter として構成されています(低周波数の単_SIDEBAND 入力も使用可能です)。Figure 6 と Figure 7 は、2つの参考周波数源に対し、数多くの異なる LO 周波数での plateau 地域のノイズ測定を示しています。1つ目の参考周波数は、Rakon 社の 30.72MHz 商用温度安定クリスタル・オスシレーター(TXCO)を使用しています。2つ目は、ディスクリート・トランジスターを使用した非常に低いフェーズ・ノイズを持つ 50MHz クリスタル・リファレンスです。統合されたフェーズ・ノイズ結果は、表3に示されています。

今回は「心の声」がついています。 どうやら英語で考えたようです(DeepSeek-R1は今のところ、英語、中国語、日本語の心の声があります)。

plateauについては、多分知らないのでそのまま出したんじゃないかと思います。 カタカナにすることも出来なかったのでしょう。 同じようにtransmitterもできなかったんでしょう。

個人的には、どうせ機械翻訳は下訳にしか使わないですから、知らない単語は素直に原語で出てくれてる方が嬉しいですから、好感度は高いです。

とは言え、a low frequency single sidebandの訳に失敗しているのは残念ですね。

「心の声」を翻訳しておきます。これはGoogle翻訳を使いました。

わかりました。提供された英語のテキストを日本語に翻訳する必要があります。文脈と関連する技術用語を理解するために、注意深く読み通します。

テキストでは、位相ノイズがチャージ ポンプ ノイズと、位相ノイズが -145dBc/Hz を超える場合は水晶リファレンスによって影響を受ける可能性のあるプラトー領域に焦点を当てて、2 つの領域における位相ノイズについて説明しています。約 -130dBc までの正確な測定には、スペクトラム アナライザの位相ノイズ パーソナリティの使用について言及しています。LMS7002M は、MXG からの DC 入力を備えたトランスミッタとして構成されており、代替入力が検討されています。図 67 は、2 つのリファレンス周波数を使用した異なる LO 周波数の測定を示しています。1 つは Rakon 30.72MHz 発振器を使用し、もう 1 つは位相ノイズが非常に低いディスクリート トランジスタ ベースの 50MHz 水晶リファレンスを使用しています。表 3 は、統合された位相ノイズの結果をまとめたものです。

「位相ノイズ」、「チャージ ポンプ ノイズ」、「水晶発振器」、「スペクトラム アナライザ」などの技術用語が正確に日本語に翻訳されていることを確認する必要があります。また、図や表の説明など、情報の明確さと構造を維持する必要があります。

正確な意味を伝え、技術的な正確さを維持しながら、セクションごとに翻訳を開始したいと思います。

ちゃんと頑張ってる様子がうかがえますw

phi-4

以下を日本語に翻訳します。

第二の領域、すなわちプラトー領域では、位相ノイズはチャージポンプノイス(および位相ノイズが約-145dBc/Hzを超えるクリスタルリファレンスのノイズ)によって支配されます。プラトー領域の位相ノイズは、図5に示すようにスペクトラムアナライザの位相ノイズ特性で測定され、約-130dBcまで正確に測定できます。LMS7002MはMXGからのDC入力を持つトランスミッタとして設定されています(低周波数のシングルサイドバンド入力を使用することもできます)。プラトー領域のノイズ測定結果は、図6および図7に、2つの異なるリファレンス周波数源に対して複数の異なるLO周波数で示されています。最初のリファレンス周波数は、Rakon製の30.72MHzの商用温度安定クリスタルオシレータ(TXCO)を使用しています。2番目のリファレンスは、非常に低い位相ノイズを持つ50MHzクリスタルリファレンス用のディスクリートトランジスタを使用しています。統合された位相ノイズの結果は、表3に与えられています。

やっぱり余分なものをつけているのが気になります。

DeepSeek-R1が失敗しているa low frequency single sidebandの訳はうまくできている感じです。

ChatGPT-4o

2の領域である「プラトー領域」では、位相ノイズは主にチャージポンプノイズ(および基準となる水晶発振器の位相ノイズが約-145dBc/Hzを上回る場合はそのノイズ)によって支配されます。プラトー領域の位相ノイズは、スペクトラムアナライザの位相ノイズ測定機能を使用して測定されます(図5参照)。この機能は約-130dBcまで正確に測定可能です。

LMS7002Mは、MXGからのDC入力を用いた送信機として構成されています(低周波単側波帯入力も使用可能です)。プラトー領域ノイズの測定結果は、異なるLO周波数と2種類の基準周波数ソースに基づいて、図6および図7に示されています。

最初の基準周波数ソースは、Rakon製30.72MHz商用温度安定型水晶発振器(TXCO)です。2つ目は、分離型トランジスタによる非常に低位相ノイズの50MHz水晶基準です。統合位相ノイズの結果は表3に示されています。

ChatGPTもplateau regionはカタカナ語にしてます。 この文は、

についての説明文なのですが、「プラトー領域」とはこのような感じのグラフの中の平坦な部分を指します。

ネットで「plateau region」を調べると、「プラトー領域」とカタカナ語にしているものが多いので、カタカナ語で正解です。 JIS翻訳の流儀に毒されている私は「平坦部」と訳すでしょうが。

a low frequency single sidebandの訳が「低周波単側波帯」となっています。 JIS的には正解な訳かなぁ。 「低周波シングルサイドバンド」でも許しますけど。

Google翻訳

2 番目の領域であるプラトー領域では、位相ノイズはチャージ ポンプ ノイズ (および位相ノイズが約 -145dBc/Hz を超える場合は水晶リファレンスからのノイズ) によって支配されます。プラトー領域の位相ノイズは、図 5 に示すように、約 -130dBc まで正確に測定できるスペクトル アナライザの位相ノイズ パーソナリティを使用して測定されます。LMS7002M は、MXG からの DC 入力 (低周波数のシングル サイドバンド入力も使用可能) を備えたトランスミッタとして構成されています。プラトー領域ノイズの測定値は、2 つのリファレンス周波数ソースのさまざまな LO 周波数について、図 6 と図 7 に示されています。最初のリファレンス周波数は、Rakon 30.72MHz の商用温度安定水晶発振器 (TXCO) です。2 番目は、ディスクリート トランジスタの非常に低い位相ノイズの 50MHz 水晶リファレンスです。統合された位相ノイズの結果は、表 3 に示されています。

a low frequency single sidebandの訳が「低周波数のシングル サイドバンド」となっています。 「の」はなくてもいいんじゃないかな。

評価

「plateau region」と「a low frequency single sideband」は人間が翻訳する時も難しかったり流儀があったりするので、DeepSeek-R1以外はまぁどれでもいいかなと思います。

それ以外については、どれも大差を感じません。

例文3

原文

The LMS7002M is a software defined radio transceiver integrated circuit radio system which can be divided into a number of simpler sections as shown in Figure 1. The phase locked loop synthesizer (PLL) generates the frequency to be modulated or demodulated in the transmitter (TX) and receiver (RX) respectively. The transmitter and receiver can be subdivided into RF, baseband (BB) and digital signal processing blocks (RSP/TSP). Measurements of the TX/RX synthesizer performance are presented in Chapter 2. Measurements of transmitter and receiver performance are presented in Chapter 3 and Chapter 4 respectively. Loop back paths exist between the transmitter and receiver at RF, analog baseband and digital baseband to allow calibration and testing. Measurements of the loop back performance are presented in Chapter 5. The LMS7002M can be operated in either single input single output (SISO) or multiple input multiple output (MIMO) configurations. Miscellaneous measurements, such as power dissipation and LDO noise, can be found in Chapter 6.

DeepSeek-R1

<think>
Alright, let's tackle this translation step by step. First, I'll read through the entire English text to grasp the overall context. It's about the LMS7002M, which is a software-defined radio transceiver integrated circuit. The text describes how it can be divided into simpler sections, as shown in Figure 1, and discusses various components like the phase locked loop synthesizer (PLL), transmitter (TX), receiver (RX), and different measurement chapters.

I need to ensure that technical terms related to radio communication and circuitry are accurately translated into Japanese. For instance, "software defined radio transceiver integrated circuit" should be translated to reflect its function and nature accurately.

Next, I'll break down the text into manageable segments to maintain clarity and ensure that each part is correctly translated without losing its meaning. For example, the part about the PLL generating frequencies for modulation or demodulation in TX and RX should be clear in Japanese.

I'll also pay attention to the structure, such as the mentions of chapters (Chapter 2, Chapter 3, etc.) and ensure that these references are appropriately translated to maintain the flow of the document.

Lastly, I'll review the translation to ensure that it reads naturally in Japanese while preserving all the technical details and nuances from the original English text.
</think>

LMS7002M は、ソフトウェア定義無線(SDR)のトランシーバー集積回路無線システムであり、Figure 1 に示すように、いくつかの simpler sections に分割可能です。フェーズロックループ合成器(PLL)は、送信機(TX)と受信機(RX)において modulation または demodulation に用いられる周波数を生成します。送信機と受信機は、さらに RF、ベースバンド(BB)、そしてデジタル信号処理ブロック(RSP/TSP)に分割可能です。TX/RX 合成器性能の測定結果は、第 2 章に示されています。送信機と受信機性能の測定結果は、それぞれ第 3 章と第 4 章に示されています。送信機と受信機之间には、RF、アナログベースバンド、デジタルベースバンドでのループバックパスが存在し、これにより校正とテストが可能です。ループバック性能の測定結果は、第 5 章に示されています。LMS7002M は、単入力単出力(SISO)又は多入力多出力(MIMO)の構成で動作可能です。電力消費や LDO ノイズなどの多雑測定は、第 6 章にあります。

今まで書いたようなクセがあります。

それは良いのですが、中国語が混ざってます。 これはちょっと使えませんね。

phi-4

以下を日本語に翻訳します。

LMS7002Mはソフトウェア定義型ラジオトランシーバーICラジオシステムであり、図1に示すように、いくつかの単純なセクションに分けることができます。位相ロックループ(PLL)合成器は、それぞれ送信機(TX)と受信機(RX)における変調または復調する周波数を生成します。送信機と受信機は、RF、基帯(BB)、およびデジタル信号処理ブロック(RSP/TSP)にさらに分割できます。送信機/受信機合成器の性能測定結果は、第2章に示されています。送信機と受信機の性能測定結果は、それぞれ第3章と第4章に示されています。送信機と受信機の間にはRF、アナログ基帯、デジタル基帯でループバックパスが存在し、キャリブレーションとテストを可能にします。ループバックパスの性能測定結果は、第5章に示されています。LMS7002Mは、シングル入力シングル出力(SISO)またはマルチ入力マルチ出力(MIMO)構成のどちらでも動作させることができます。消費電力やLDOノイズなどのさまざまな測定結果は、第6章にあります。

相変わらずw

basebandは「基帯」と訳されていますが、カタカナ語の方が良いと思います。

ChatGPT-4o

LMS7002Mは、ソフトウェア定義型無線トランシーバー集積回路(IC)ラジオシステムであり、図1に示されるように、いくつかの簡単なセクションに分割できます。位相ロックループ(PLL)シンセサイザは、送信機(TX)および受信機(RX)でそれぞれ変調または復調される周波数を生成します。送信機と受信機は、RF、ベースバンド(BB)、およびデジタル信号処理ブロック(RSP/TSP)にさらに分割することができます。

送信機および受信機のシンセサイザ性能の測定結果は第2章に記載されています。送信機と受信機の性能測定結果は、それぞれ第3章と第4章に記載されています。校正やテストを可能にするため、送信機と受信機の間にはRF、アナログベースバンド、およびデジタルベースバンドでループバック経路が存在します。ループバック性能の測定結果は第5章に示されています。

LMS7002Mは、単一入力単一出力(SISO)または多入力多出力(MIMO)構成で動作可能です。消費電力やLDOノイズなどのその他の測定結果については、第6章に記載されています。

まぁ妥当ですね、以外の言葉が見つかりません。

原文と比較するとわかりますが、「(IC)」は勝手に補われたものです。 多分、こういった文章のスタイルを真似ているのでしょうし、他の語は原文にもこういった感じの略語が書いてあるので、それに揃えたのかも知れません。

そう考えれば、ことこの部分に関してはかなり品質が高い訳だと言えます。

Google翻訳

LMS7002M は、ソフトウェア定義無線トランシーバ集積回路無線システムで、図 1 に示すように、いくつかのより単純なセクションに分割できます。位相ロック ループ シンセサイザ (PLL) は、送信機 (TX) と受信機 (RX) でそれぞれ変調または復調される周波数を生成します。送信機と受信機は、RF、ベースバンド (BB)、およびデジタル信号処理ブロック (RSP/TSP) に細分化できます。TX/RX シンセサイザのパフォーマンスの測定は、第 2 章で説明します。送信機と受信機のパフォーマンスの測定は、それぞれ第 3 章と第 4 章で説明します。RF、アナログ ベースバンド、およびデジタル ベースバンドで送信機と受信機の間にループ バック パスが存在し、キャリブレーションとテストが可能です。ループ バック パフォーマンスの測定は、第 5 章で説明します。LMS7002M は、シングル入力シングル出力 (SISO) またはマルチ入力マルチ出力 (MIMO) 構成で動作できます。消費電力や LDO ノイズなどのその他の測定については、第 6 章を参照してください。

ソツのない機械翻訳らしい翻訳です。 他に言う言葉がありませんw

評価

原文はこのドキュメントのイントロの部分です。 そのため、わかりやすくはっきり書かれているところですから、翻訳はしやすいんじゃないかと思います。 Google翻訳のソツのない翻訳でも、十分「使える」という感じの訳です。

DeepSeek-R1に中国語が混ざったり、phi-4が変な訳語を使っていたりということで思い出したのが、これらはあまり日本語特化の学習をさせられていないということです。 日本語が使えるのは、「たまたま」に近いことであると考えると、これらの基本性能の良さを感じます。

まとめ

4つを比較すると、DeepSeek-R1を除けば「甲乙」と言うよりは「どれが好きか」というレベルじゃないかと思います。

DeepSeek-R1はちょっと落ちるなぁという感じではありますが、前のテストや普段使っている感じからすると「ここは彼の仕事ではない」という感じです。 ダメじゃないけど向いてない仕事だよねと。

それを思うと、phi-4の健闘は素晴しいです。 LLMですから速度的には残念ですが、「オープンソースで実用になる翻訳システム」というものが皆無だということを思えば、なかなか良いものが手に入ったように思います。 バッチ処理で翻訳させたい時には、いいエンジンになってくれそうに思います。 そういった使い方をGoogle翻訳でやると怒られますからね。 翻訳に必要な「単語帳」はプロンプトに含めると良いかも知れませんし、何ならLoRA作るのもアリかも知れません。

例文3の評価でも書いたように、DeepSeek-R1にしてもphi-4にしても、特別に日本語を意識した学習がされたものではありません。 しかし、いずれもオープンソースを自称しライセンスもOSDライセンスですから、おそらく今後どこかの機関から「日本語強化版」が出て来るんじゃないかと思います。 それが使えるようになれば、よりマトモな日本語が出て来る… とか考えたら、現状の「日本語が…」というツッコミは「無理言うなよ」かも知れません。

などなど考えると、こういったタスクでlocal-LLMが実用になるのは、あと半歩くらいでしょうか。 夏頃までにはこの手のタスクはlocal-LLMで(速度を別にすれば)十分という時代が来るのかも知れません。

機会があれば、より文学的な文章の翻訳も試してみたいと思います。

最近のエントリー

ブラウザでの画面表示と印刷の描画差異に関する実践的考察

RSSリーダを作りました

Puppeteerは過去の遺物だったのでPlaywrightにした話

💥 Prisma vs Sequelize:実戦投入してわかった本当の話

第14回 人工知能は「第五の火」である

DeepSeek-R1-Distill-Qwen-14B-Japaneseの量子化ビット数による答えの精度の違い

使われていないMaix Amigo を活用して、バーコードリーダーにする

TinySwallow-1.5B-Instruct

cyberagent/DeepSeek-R1-Distill-Qwen-14B-Japanese

パスワードマネージャの一手法(公知化情報)

中華安お掃除ロボット(650円)を買ってみました

phi-4とDeepSeek-R1の翻訳性能比較

phi-4

DeepSeek-R1-Distill-Qwen-14B

新オフィスの様子

基本のパン

社会制度のこと

気候のこと

新春のお散歩

あけましておめでとうございます