ollamaからhermes agentをインストールしました。インストール自体は簡単でした。ターミナルから簡単なコマンド一つでできるんだけど・・・その後の設定で固まってしまいました。
ollamaからのインストールはコード一つで
「またターミナルで何個もコマンド打つんだろうな〜」
と思っていました。
ところが実際は…。
コマンド1つだけでした(笑)
ターミナルを開いて、これを入力するだけです。
ollama launch hermes
Enterを押すとダウンロードが始まり、
しばらく待つだけ。
「え?もう終わり?」
って思うくらい簡単でした。
ここまでは順調
インストールも無事に終わり、
「これは余裕だな」
なんて思っていました。
…。
甘かったです(笑)
設定画面を見てフリーズ
Hermes Agentを起動すると、設定画面が出てきました。現在は慣れたけど、初見でこの画面はハードルが高いです

急に難易度が跳ね上がった感じでした。
ここからAI先生の協力で設定していきました
AIに聞きまくる(笑)
ここからは、
ChatGPT先生に聞きまくりでした。
「ここ何を選べばいいの?」
「この設定で合ってる?」
分からないところが出るたびに質問。
本当に先生みたいでした(笑)

ここが焦ったwこれはアプリと繋ぐかって設定なので「Set up later」を選択
少しずつ分かってきた
不思議なもので、
最初は怖い呪文に見えていた英語の設定も、
一つずつ意味が分かってきます。
「なるほど、こういうことか。」
そう思える瞬間が増えてきました。
もちろん全部理解できるわけありませんw

無事設定完了!
次回予告
なんとかHermes Agentの設定も終わり、いよいよ使えるようになりました。
でも実際に使ってみると、
「結局何に使ったらいいの?」
と全く活用できない。
次回は、Hermes Agentを実際に使って感じたことを書こうと思います。
主なローカルLLMの種類と特徴
賢いモデルを使いたくなる私。でもスペックで使えないこともある。
さらに、そのAIによっても得意分野が違うという。種類も多い。何使っていいか今でも全くわかりません。
少しまとめてもらいました。私の環境だとこんな感じだということです。
| モデルの種類 | 主な特徴 | 得意なこと | 主なサイズ | 快適に動かすメモリの目安 | Mac Studio M1・32GBでの目安 |
|---|---|---|---|---|---|
| Qwen | Alibabaが開発。日本語を含む多言語への対応力が比較的高く、モデルサイズの選択肢も多い | 日本語の文章作成、要約、プログラミング、考えながら答える作業 | 4B・8B・14B・30B・32Bなど | 4B:8GB以上8B:12~16GB以上14B:20~24GB以上30B以上:48GB以上推奨 | 8B前後が快適。14Bも使用可能。30B・32Bは動いても待ち時間が長くなりやすい |
| Gemma | Googleが開発。比較的小型でも文章生成能力が高く、画像を読み取れるモデルもある | 会話、文章作成、要約、画像の内容説明 | 1B・4B・12B・27B | 4B:8GB以上12B:16~24GB以上27B:32~48GB以上 | 4B・12Bが使いやすい。27Bはメモリを多く使い、長文では重くなりやすい |
| GPT-OSS | OpenAIが公開した、考える作業を重視したオープンウェイトモデル | 推論、プログラミング、複数手順の問題解決、ツールを使うAIエージェント | 20B・120B | 20B:最低16GB、快適には24~32GB程度120B:約80GB以上 | 20Bは使用可能。ただし長く考える質問では遅くなることがある。120Bは32GBでは難しい |
| Llama | Metaが開発。対応アプリが多く、ローカルLLMの基本モデルとして広く使われている | 会話、要約、文章の書き換え、簡単な分類 | 1B・3B・8B・70Bなど | 1B・3B:8GB程度8B:12~16GB以上70B:64GB以上 | 3B・8Bが快適。日本語ではQwenなどの方が自然に感じる場合がある |
| Mistral | フランスのMistral AIが開発。比較的高速で、指示への応答やツール連携にも向いている | 会話、文章作成、プログラミング、AIエージェント | 3B・7B・24Bなど | 7B:12~16GB以上24B:32~48GB以上 | 7B前後は快適。24Bは動作可能でも余裕は少なめ |
| DeepSeek-R1系 | 答えを出す前に長く考える「推論型」のモデル。小型化された派生モデルもある | 数学、論理問題、プログラミング、複雑な問題の整理 | 1.5B・7B・8B・14B・32Bなど | 8B:12~16GB以上14B:20~24GB以上32B:48GB以上推奨 | 8B・14Bは使用可能。ただしThinkingが長く続くことがある |
Qwen3には0.6Bから32Bまでの通常モデルに加え、30Bのうち一部だけを動かすMoEモデルも用意されています。
Gemma 3には1B・4B・12B・27Bがあり、4B以上では最大128Kの長い入力と画像入力に対応しています。
GPT-OSSには20Bと120Bがあり、OpenAIの公式説明では20Bは16GB、120Bは80GBのメモリで動作可能とされています。
Llama 3.2の軽量モデルは1Bと3Bで、最大128Kのコンテキストに対応しています。
Mistral Small 3は24Bモデルとして公開され、会話、指示への応答、プログラミングなどを想定しています。
DeepSeek-R1には小型の蒸留モデルが用意され、8Bや32Bなどをローカル環境で利用できます。
サイズ表記の見方
モデル名の横にある「4B」「8B」「27B」などの数字は、基本的にはモデルが持つパラメータ数の大きさを表しています。
| 表記 | 意味 | 初心者向けのイメージ |
|---|---|---|
| 1B~4B | 約10億~40億パラメータ | 軽くて速い。簡単な会話や要約向き |
| 7B~9B | 約70億~90億パラメータ | 速度と賢さのバランスがよい |
| 12B~14B | 約120億~140億パラメータ | 文章力や理解力が上がるが、少し重い |
| 20B~32B | 約200億~320億パラメータ | より賢いが、32GBのMacでは余裕が少ない |
| 70B以上 | 約700億パラメータ以上 | 高性能だが、大容量メモリが必要 |
ただし、数字が大きければ必ず使いやすいとは限りません。
大きなモデルを選ぶと、
- 回答が始まるまで時間がかかる
- Macのメモリ使用量が90%を超える
- 本体が熱くなる
- Thinkingが長時間続く
- 他のアプリまで遅くなる
といったことがあります。
私の32GBのMacで選ぶなら
Mac Studio M1・メモリ32GBの場合は、
| 用途 | おすすめサイズ |
|---|---|
| 初めてローカルLLMを試す | 4B前後 |
| 普段の会話やブログ作成 | 8B~12B前後 |
| 少し複雑な文章やプログラミング | 14B前後 |
| 推論性能を重視する | GPT-OSS 20Bなど |
| 27B・30B・32B | 動く場合はあるが、快適さは落ちやすい |
| 70B・120B | 32GB環境では現実的ではない |
初心者におすすめの選び方
最初から一番大きなモデルを選ぶよりも、まずは4B~8B程度の軽いモデルから試すのがおすすめのようです。
軽いモデルで正常に動くことを確認してから、
4B → 8B → 12Bまたは14B
という順番で大きくしていくと、自分のMacに合ったモデルを見つけやすくなるそうです。
結局よく使う私がよく使うモデルは「Gemma4:4B」に落ち着きました。
理由は応答が早いからです!!
コメント