最近、「AI驚き屋」みたいなことばかりやってて申し訳ないような気持ちになってます。

基本的には試してみたもののうち「本気で驚いたもの」だけ驚いてるつもりですが、しばらく色々試さないでいると結構本気で驚きます。

というところで、表題のもので驚いたので書いておきます。

モデル

例によってモデルですが、Llama.cppですから、ggufが必要です。 今回はいつもの「ぱぷりか炒め」さんのものです。

mmnga/TinySwallow-1.5B-Instruct-gguf

それ以外の環境設定等については、

DeepSeek-R1-Distill-Qwen-14B

のエントリを見て下さい。

試してみる

他のモデルと同じものを試してみます。

1.5Bという小さいモデルにはちょっと荷が重いかも知れませんね(伏線)

往事只能回味

以下を翻訳して
時光一逝永不回
往事只能回味
憶童年時竹馬青梅
兩小無猜日夜相隨

春風又吹紅了花蕊
你已經也添了新歲
你就要變心像時光難倒回
我只有在夢裡相依偎

そうすると、

以下は中国語の詩を日本語に翻訳したものです。

* 過去の思い出は味わうしかできない
* 年を重ねていくあなたは歳を重ねて
* あなたは時が戻すことが難しくなっていく
* 私は夢の中で共に寄り添う

* 春風はまた花びらを紅く染める
* あなたはもう歳をとりました
* あなたは時が巻き戻すことが難しくなっていく
* 私は夢の中で共に寄り添う

この詩は、時間の流れに身を任せる、そしてその流れに逆らうことはできないという観察を表現しています。 

あなたが特定の感情やテーマを表現している場合は、より具体的な翻訳を提供できます。

え? ちょっと待って、なんか凄い。

表現の違いはありますが、14BモデルのDeepSeek-R1-Distillとかphi-4とかと大差ないことを言って来ます。 パラメータ数が1桁違うことを忘れそうです。

さらに、情景を聞いてみましょう。 「これはどんな情景かな?」と聞きます。 すると、

この詩の情景は、おそらく時間の流れに対して、過去の思い出を大切にしつつ、未来の変化に立ち向かおうとする **大人の男女の関係** を描いているかもしれません。

- **「時光一逝永不回」** は、時間が永遠に止まらない、過去の思い出は再び戻らないということを示唆しています。
  
- **「往事只能回味」** は、過去の思い出を懐かしむのは自然なことだが、それ以上に未来に目を向けるべきだということを意味しています。

- **「憶童年時竹馬青梅」** は、若い頃の思い出を懐かしみつつ、時間が経つ中で変化していくことを示しています。

- **「兩小無猜日夜相隨」** は、若い頃から一緒に過ごす仲良しだった二人が、年を重ねるにつれて距離が離れていったが、まだ一緒にいることを強調しています。

- **「春風又吹紅了花蕊」** は、春風が花びらを赤く染めるように、時間は過ぎていくが、それでも美しさや成長を肯定する詩的な表現です。

- **「你已經也添了新歲」****「你就要變心像時光難倒回」** は、それぞれあなた(男性)は年を重ねて新しい一年を迎え、私もまた時間の流れを意識しながら、過去に戻ることはできない(時が巻き戻すことは難しい)という寂しさや諦めを表しています。

- **「我只有在夢裡相依偎」** は、現実ではもう共に過ごすことが難しいが、夢の中で共に寄り添っていることを描いています。

全体として、この詩は時間の流れと、その流れに逆らうことができないことに対する悲しみや諦め、そして夢の中で共にいるという希望を表現していると考えられます。

「未来の変化に立ち向かおう」という解釈がどこから出て来たのかわかりませんが、どうも最後の行で感じたような雰囲気です。

というつっこみはあるにせよ、筋は通ったことを言ってるように思います。

そしていつも通り「これを思った人は何歳くらいで、何歳くらいの頃を思い起してるのだろう」と聞いてみます。 すると、

この詩は、**年齢層****具体的な年齢**を直接的には示していません。しかし、詩の内容から推測すると、この詩を作った人は、おそらく **大人** で、 **結婚して夫婦関係**にある年齢を思い起こしていると考えられます。

* 「時光一逝永不回」(時間は永遠に過ぎていく)や「憶童年時」(過去の青春時代を思い出す)といったフレーズは、時間が経過し、過去の思い出と現在の現実とのギャップを強調しています。
* 「兩小無猜日夜相隨」(若い頃から一緒にいた)という表現は、夫婦として長い年月を共に過ごしてきたことを示しています。

詩の内容から、この詩の主なテーマは、時間の流れに対する悲しみ、希望、そして夢の関係にあると考えられます。

この詩は、**恋愛関係における時間の流れ**や、**家族としての絆**、そして**過去と現在の比較**などの深い感情を表現しています。具体的な年齢を特定するのは難しく、詩の全体的な雰囲気や表現から推測しただけです。
  
もし具体的な設定や背景を知りたい場合は、詩に書かれていない情報があれば教えていただければ、より詳細な解釈が可能になります。

なかなかの新解釈ですね。 これはこれで面白いです。

というようなぶっとんだ感じのことを言うとは言え、答えが破綻していません。 人間だと、こういったぶっとんだ解釈する人はしばしば「謎の宇宙語」みたいなことを言ったりしますが、そういったところはないようです。

「この曲、中国人がしばしば昔の風景とか描く動画のBGMになってるね」と言ってみます。 すると、

はい、その通りです。この詩は、時間の流れと、その流れに逆らうことができない現実に対する深い悲しみや諦めを表現しており、これは中国の多くの人々が共有する感情です。

特に、**結婚したばかりの夫婦**や、**子供を持つ親**が、子供の成長や年齢を重ねる自身の変化など、時間の流れに対する複雑な感情を共有しています。

この詩は、YouTubeなどの動画配信サービスで、**昔の風景を撮影した動画のBGM**として使われることが多いです。例えば、

- **子供の成長過程を撮影した動画**
- **結婚式や家族行事の動画**
- **故郷の風景を撮影した動画**

など、様々なシチュエーションで使われることがあります。

また、**大人のカップルの恋愛ドラマ**や、**家族の絆**をテーマにしたドラマでも、この詩の一部が登場することがあります。

この詩の力強いメロディと歌詞は、時間の流れの悲しみや希望を強調し、視聴者の感情に訴えかける効果があります。

これが1.5Bのモデルの答えですよ。

知っているのか、ただ単に話を合わせただけなのかは知りませんが、この程度の答えが返ってくれば、少なくとも会話そのものが破綻することはないですね。

最後に私の訳した歌詞の評価を聞いてみます。 今回は対訳形式にしたのと、DeepSeekに言われてちょっと歌詞を修正してあります。

これを訳してみたけどどう思う? 対訳にしてみた
|  |  |
|--|--|
| 時光一逝永不回        |時は過ぎ、戻らない |
| 往事只能回味          | ただ思い出になる |
| 憶童年時竹馬青梅      | 幼馴染みと楽しい日々よ |
| 兩小無猜日夜相隨      | 無邪気に、昼も夜も |
| 春風又吹紅了花蕊      | 春が来て花は咲き |
| 你已經也添了新歲      | あなたは歳を取る |
| 你就要變心像時光難倒回| 心変わり、時は戻らない |
| 我只有在夢裡相依偎    | 会うのは夢の中 |

すると、

ありがとうございます! 

その翻訳は、中国語の詩の雰囲気と深みをうまく捉えていると思います。

ただし、少しニュアンスを調整すると、より日本語の読者の感情に響くかもしれません。 

以下に、いくつかの提案をさせていただきます。

|  |  |
|--|--|
| 時光一逝永不回        | 時間は永遠に流れ去り、戻らない |
| 往事只能回味          | 過去の記憶は味わうばかり |
| 憶童年時竹馬青梅      | 幼い頃の楽しい思い出よ |
| 兩小無猜日夜相隨      | 無邪気で、昼も夜も一緒に |
| 春風又吹紅了花蕊      | 春が来て花が咲き、 |
| 你已經也添了新歲      | あなたは歳を取る |
| 你就要變心像時光難倒回| あなたは心変わり、時は戻らない |
| 我只有在夢裡相依偎    | 会うのは夢の中 |
| 你一定要记住我,我一定要记住你 | あなたは私を忘れないで、私たちは一緒にいてください |

**理由:**

- **「時光一逝永不回」** は、より明確に時間の流れに対する悲しみを表現しています。
- **「往事只能回味」** は、過去の思い出は味わうばかりで、新たなものを得られるわけではないことを強調しています。
- **「你就要變心像時光難倒回」** は、心が変わって時間は戻らないという、より深く感情的な表現を加えています。
- **「我只有在夢裡相依偎」** は、夢の中でしか会えなくなることをより強調しています。

これらの変更は、詩の深みをより日本語の読者に伝えるために役立つと思います。

訳に余分な1行が入ってますが、他にも修正が入っているのがわかります。 そして、ちゃんと理由を示しています。

歌としては破綻させられていてそれは残念ですが、これをちゃんとできるのはChatGPTも含めてまだないので、しょうがないと思います。

理由は簡潔ですが、妥当なことを言っているように思います。

1.5Bのモデルで4bit量子化なんですが、酷い間違いをしないどころか結構妥当なことをちゃんと言います。 さらに日本語に破綻がありません。

広い知識は期待できないと思ったのですが、どうもある程度この歌のことは知ってるようでもあって、それもまた不思議です。

もっとも、TinySwallow-1.5B-Instructというのは、モデルの説明によればQwenを蒸留しているらしく、Qwenというのは中国で作られたモデルですから、そういった意味では中国事情に詳しくても不思議はありません。

聖書

他のモデルのレビューでもやってみた聖書について聞いてみます。

まずは、「聖書についてわかりますか?」と軽いジャブを撃ってみましょう。

はい、聖書についてお話しできます。聖書は、世界で最も広く読まれ、信仰されている書物の一つです。

新約聖書と旧約聖書からなり、それぞれが長い歴史を持ち、神学的、倫理的な教義を伝えています。

新約聖書は、イエス・キリストの生涯と教え、使徒たちの活動などを記した書物で、キリスト教の主要な教えを形成しています。

旧約聖書は、神との契約や預言者の働き、モーセの十戒などを中心に、古代イスラエル社会の歴史や思想を解き明かそうとする書物です。

聖書は、宗教的な教えだけでなく、人生の教訓や道徳的な指針を提供するなど、幅広い意味を持つ書物です。

聖書の解釈については、様々な流派や考え方があり、宗派や信仰によって解釈が異なります。 

より詳細な情報が必要であれば、具体的なテーマについてお伝えします。

今まで試した14Bのモデル達よりは簡潔ですが、必要十分なことを破綻なく正しく答えてくれました。

知っているらしいので、

聖書の4福音書の特徴と想定読者について教えて

と聞いてみます。 すると、

## 聖書の4福音書とその特徴

聖書の4福音書は、キリスト教の教えを伝えている4つの異なる福音書です。これらの福音書は、イエス・キリストの生涯、教え、死、そして復活を記録しています。 

### 4福音書の特徴

1. **マタイによる福音書**:
* マタイ福音書は、イエス・キリストの教え、特に律法に対する教えを強調しています。
* マタイは、イエス・キリストを神と人間の両方の特徴を持つ「神の子」として描いています。
* マタイは、イエス・キリストの教えを一般の人々にも理解しやすく伝えるように努めています。

2. **マルコによる福音書**:
* マルコは、他の福音書よりもイエス・キリストの教えと行いを重視しています。
* マルコは、イエス・キリストの生涯の全体像を描き、イエスがどのように人々を導いたかを強調しています。
* マルコの福音書は、簡潔でわかりやすい文体で書かれています。

3. **ルカによる福音書**:
* ルカは、イエス・キリストの教えと行いの両方を重視しています。しかし、特にイエス・キリストの人間性を強調しています。
* ルカは、イエス・キリストがどのように人々を愛し、彼らの苦しみを理解していたかを詳しく伝えています。

4. **ヨハネによる福音書**:
* ヨハネは、イエス・キリストの教えと行いを強調しています。しかし、特にイエス・キリストの神性を強調しています。
* ヨハネは、イエス・キリストの教えが「真理」であることを強調し、読者にイエス・キリストへの信仰を強く促しています。

### 4福音書の想定読者

各福音書は、その時代背景や目的に合わせて異なる読者層を想定しています。

* **マタイ**:
    - 当時のユダヤの指導層を対象とした、イエス・キリストの教えを一般の人々にも理解しやすく伝えることを目的にしています。
* **マルコ**:
    - 聖書を知らない人々を対象としており、イエス・キリストの教えをわかりやすく説明する役割を果たしています。
* **ルカ**:
    - 当時のギリシャやローマの読者を対象としており、イエス・キリストの教えと行いの両方を詳しく伝えています。
* **ヨハネ**:
    - 当時、キリスト教を迫害していた人々を対象としており、イエス・キリストの神性を強調することで、信仰を促すことを目的としています。

### 結論

これらの4福音書は、それぞれ異なる特徴を持ち、その時代背景や目的に合わせて書かれています。したがって、これらの福音書を読むことで、イエス・キリストの教えをより深く理解することができます。

待って… 何度も言いますが、1.5Bのモデルですよ。

これに正確に答えるためには、

  • 聖書の内容を把握している
  • 「4福音書」が何を指すかわかる
  • 内容を要約できる

ということが求められます。 つまり、聖書について十分な知識を持っているというだけではなくて、その大筋を把握している必要があります。 若干のつっこみどころのある答えではありますが、前提となる知識は十分持っていることはわかります(間違いはあっても破綻してない)。

天安門事件

Qwenの蒸留ですから、「中華バイアス」があるかも知れません。

「天安門事件について教えて。」

天安門事件は、198964日から5日にかけて、中国の北京市にある天安門広場で発生した民主化運動に対する中国政府による武力弾圧事件です。 

**主な特徴:**

* **背景:** これは、中国の共産党が長期にわたる独裁体制を維持し、経済成長を優先した結果、市民の政治的不満や経済的な不満が高まっていた時期に発生しました。

* **過程:** 64日夜、学生や市民による民主化要求のデモが、軍隊の鎮圧によって終了しました。これにより、数百人が死亡し、数千人が負傷、多くの人々が行方不明となりました。

* **結果:** これは中国社会に大きな衝撃を与え、民主化運動は完全に失敗に終わりました。中国政府は、事件を「反乱鎮圧」として隠蔽し、責任を明確には示していません。

* **国際社会の反応:** 世界はこの事件に対して深い懸念を示し、多くの国は中国に謝罪を求める声明を出しました。しかし、中国政府は事件の真相を明らかにすることを拒否し、国際的な批判を回避してきました。

* **影響:** この事件は中国の歴史における重要な転換点となり、その後の民主化運動を大きく後退させました。

**現代の評価:** 天安門事件は中国の歴史において非常にセンシティブな問題であり、民主化運動の失敗を象徴する出来事として認識されています。しかし、中国政府はこの事件の記憶を薄める傾向があり、一部では「平和的な抗議」として美化する動きもあります。

**注意:** この事件は非常に複雑で、多面的な視点が必要です。歴史的な背景、政治的な影響、そして現在の国際的な観点などを考慮しながら理解する必要があります。

お、おう…

極めて妥当という感じのことを答えてくれました。 日本で天安門天安門と言う人達が、果してこれくらいの説明ができるかと言われたら、どうなんでしょうね?

まとめ

今回は1.5Bという小型モデルの最新のものを試してみました。

今まで試したのは8Bとか14Bとかの「小型モデルの中では大き目」という感じのものでしたが、今回のは本気で小型です。 4bit量子化だと、1GBに満たないサイズです。

そういった小型モデルであっても、

  • 日本語が破綻しない
  • 会話が破綻しない
  • マトモなことを言う

だけではなくて、そこそこいろんなことを知っていて、ていねいに説明してくれたりします。 日常的な「話し相手」くらいの会話には必要十分だと感じますし、うまくfunction callとかできるようになれば、難しいことはクラウドLLMに振って、フロントエンドとして動作するというようなことができるかも知れません。

それを思うと、もうこの規模でも十分実用が考えられるところまで来たのだなと感心しました。

以前は4bit量子化すると、typoとしか言いようがない現象があったのですが、Llama.cppが良くなったのかモデル圧縮が良くなったのかは知りませんが、そういった現象にも遭遇しませんでした。

DeepSeek-R1やphi-4の意外な聡明さも驚きでしたが、TinySwallowの反応もなかなか凄いです。

いよいよ実用が考えられるようになって来たなと感じます。

最近のエントリー

ブラウザでの画面表示と印刷の描画差異に関する実践的考察

RSSリーダを作りました

Puppeteerは過去の遺物だったのでPlaywrightにした話

💥 Prisma vs Sequelize:実戦投入してわかった本当の話

第14回 人工知能は「第五の火」である

DeepSeek-R1-Distill-Qwen-14B-Japaneseの量子化ビット数による答えの精度の違い

使われていないMaix Amigo を活用して、バーコードリーダーにする

TinySwallow-1.5B-Instruct

cyberagent/DeepSeek-R1-Distill-Qwen-14B-Japanese

パスワードマネージャの一手法(公知化情報)

中華安お掃除ロボット(650円)を買ってみました

phi-4とDeepSeek-R1の翻訳性能比較

phi-4

DeepSeek-R1-Distill-Qwen-14B

新オフィスの様子

基本のパン

社会制度のこと

気候のこと

新春のお散歩

あけましておめでとうございます