みなさんGWしてますか? 私はCatchUp(RSSリーダのことです)を強化するのが楽しくなって色々やっています。

AI agentの要領がわかって来たので、どんな構成にするとかどんなプロンプトにするとかやっていると、完全にハマってしまいますね。

というわけで、公開してから

  • 思考構造の変更
  • 雑談機能
  • 文脈やペルソナの処理

とかを強化してしまいました。

人工知能にまたブームが来て、今度は本物っぽいなと感じています。

前回のブーム(人工知能学会が出来た頃)に人工知能という名のついた部署の仕事をしていたことや、深層理解がやりたくて留学とか考えてたことを思うと、「いよいよ時代がやって来た」という感じがします。

とは言え、いろんな事情から出遅れてしまって、指をくわえて見てるだけ… の時代が長くなってしまいました。

それはそれで残念なことなのですが、お陰で見えて来たことがあって、それが表題のことです。

ローカルLLMの商談があったので、表題のものを調べてみました。

今まで、量子化ビット数による違いは「トークン間違い」くらいしか気にしてなかったのですが、結構結果が違うようです。

ごちゃごちゃ書かないで、結果とそこへのツッコミだけ出しておきます。

最近、「AI驚き屋」みたいなことばかりやってて申し訳ないような気持ちになってます。

基本的には試してみたもののうち「本気で驚いたもの」だけ驚いてるつもりですが、しばらく色々試さないでいると結構本気で驚きます。

というところで、表題のもので驚いたので書いておきます。

前のエントリの追記にも書きましたが、サイバーエージェントからDeepSeek-R1の日本語対応版が出ました。

cyberagent/DeepSeek-R1-Distill-Qwen-14B-Japanese

cyberagent/DeepSeek-R1-Distill-Qwen-32B-Japanese

さっそくggufが作られています。

bluepen5805/DeepSeek-R1-Distill-Qwen-14B-Japanese-gguf

bluepen5805/DeepSeek-R1-Distill-Qwen-32B-Japanese-gguf

ということで試してみます。

DeepSeek-R1-Distill-Qwen-14Bのggufがあったので試してみました。

試してみると、「ヤバいヤバい」以外の声が出せないくらい「凄い」としか言いようがなくて、この驚きは初めてChatGPTを使った時のような感じですし、ある意味それ以上かも知れません。

この驚きを共有してもらうために、エントリ書いてみます。

最近のエントリー

金曜ごはん #15 「フジツボ香るポトフと手作り肉まん」

ある冬の晴れた日、海岸でフジツボに出会いました

金曜ごはん #14 「手作りつくね鍋~スーパーに導かれて~」

SaaS基盤のアイディア (公知化情報)

第18回 3年以内に起きる「オンプレ回帰」の5つの具体的イベント予測

金曜ごはん #13 「醤油と塩の2種のお鍋」

CassetteOSのロードマップ

Orcinusを開発した理由

12月スタート!事務所をクリスマス仕様にしました

金曜ごはん #12 「リピートハンバーグ」

第17回 業務システムをオープンソースで作ること