Hermes Agentを入れてみた｜インストールは簡単。でも設定は意味不明でした（笑）

URLをコピーしました！

ollamaからhermes agentをインストールしました。インストール自体は簡単でした。ターミナルから簡単なコマンド一つでできるんだけど・・・その後の設定で固まってしまいました。

ollamaからのインストールはコード一つで

「またターミナルで何個もコマンド打つんだろうな〜」

と思っていました。

ところが実際は…。

コマンド1つだけでした（笑）

ターミナルを開いて、これを入力するだけです。

ollama launch hermes

Enterを押すとダウンロードが始まり、

しばらく待つだけ。

「え？もう終わり？」

って思うくらい簡単でした。

ここまでは順調

インストールも無事に終わり、

「これは余裕だな」

なんて思っていました。

…。

甘かったです（笑）

設定画面を見てフリーズ

Hermes Agentを起動すると、設定画面が出てきました。現在は慣れたけど、初見でこの画面はハードルが高いです

急に難易度が跳ね上がった感じでした。

ここからAI先生の協力で設定していきました

AIに聞きまくる（笑）

ここからは、

ChatGPT先生に聞きまくりでした。

「ここ何を選べばいいの？」

「この設定で合ってる？」

分からないところが出るたびに質問。

本当に先生みたいでした（笑）

ここが焦ったwこれはアプリと繋ぐかって設定なので「Set up later」を選択

少しずつ分かってきた

不思議なもので、

最初は怖い呪文に見えていた英語の設定も、

一つずつ意味が分かってきます。

「なるほど、こういうことか。」

そう思える瞬間が増えてきました。

もちろん全部理解できるわけありませんw

無事設定完了！

次回予告

なんとかHermes Agentの設定も終わり、いよいよ使えるようになりました。

でも実際に使ってみると、

「結局何に使ったらいいの？」

と全く活用できない。

次回は、Hermes Agentを実際に使って感じたことを書こうと思います。

主なローカルLLMの種類と特徴

賢いモデルを使いたくなる私。でもスペックで使えないこともある。

さらに、そのAIによっても得意分野が違うという。種類も多い。何使っていいか今でも全くわかりません。

少しまとめてもらいました。私の環境だとこんな感じだということです。

モデルの種類	主な特徴	得意なこと	主なサイズ	快適に動かすメモリの目安	Mac Studio M1・32GBでの目安
Qwen	Alibabaが開発。日本語を含む多言語への対応力が比較的高く、モデルサイズの選択肢も多い	日本語の文章作成、要約、プログラミング、考えながら答える作業	4B・8B・14B・30B・32Bなど	4B：8GB以上8B：12～16GB以上14B：20～24GB以上30B以上：48GB以上推奨	8B前後が快適。14Bも使用可能。30B・32Bは動いても待ち時間が長くなりやすい
Gemma	Googleが開発。比較的小型でも文章生成能力が高く、画像を読み取れるモデルもある	会話、文章作成、要約、画像の内容説明	1B・4B・12B・27B	4B：8GB以上12B：16～24GB以上27B：32～48GB以上	4B・12Bが使いやすい。27Bはメモリを多く使い、長文では重くなりやすい
GPT-OSS	OpenAIが公開した、考える作業を重視したオープンウェイトモデル	推論、プログラミング、複数手順の問題解決、ツールを使うAIエージェント	20B・120B	20B：最低16GB、快適には24～32GB程度120B：約80GB以上	20Bは使用可能。ただし長く考える質問では遅くなることがある。120Bは32GBでは難しい
Llama	Metaが開発。対応アプリが多く、ローカルLLMの基本モデルとして広く使われている	会話、要約、文章の書き換え、簡単な分類	1B・3B・8B・70Bなど	1B・3B：8GB程度8B：12～16GB以上70B：64GB以上	3B・8Bが快適。日本語ではQwenなどの方が自然に感じる場合がある
Mistral	フランスのMistral AIが開発。比較的高速で、指示への応答やツール連携にも向いている	会話、文章作成、プログラミング、AIエージェント	3B・7B・24Bなど	7B：12～16GB以上24B：32～48GB以上	7B前後は快適。24Bは動作可能でも余裕は少なめ
DeepSeek-R1系	答えを出す前に長く考える「推論型」のモデル。小型化された派生モデルもある	数学、論理問題、プログラミング、複雑な問題の整理	1.5B・7B・8B・14B・32Bなど	8B：12～16GB以上14B：20～24GB以上32B：48GB以上推奨	8B・14Bは使用可能。ただしThinkingが長く続くことがある

Qwen3には0.6Bから32Bまでの通常モデルに加え、30Bのうち一部だけを動かすMoEモデルも用意されています。

Gemma 3には1B・4B・12B・27Bがあり、4B以上では最大128Kの長い入力と画像入力に対応しています。

GPT-OSSには20Bと120Bがあり、OpenAIの公式説明では20Bは16GB、120Bは80GBのメモリで動作可能とされています。

Llama 3.2の軽量モデルは1Bと3Bで、最大128Kのコンテキストに対応しています。

Mistral Small 3は24Bモデルとして公開され、会話、指示への応答、プログラミングなどを想定しています。

DeepSeek-R1には小型の蒸留モデルが用意され、8Bや32Bなどをローカル環境で利用できます。

サイズ表記の見方

モデル名の横にある「4B」「8B」「27B」などの数字は、基本的にはモデルが持つパラメータ数の大きさを表しています。

表記	意味	初心者向けのイメージ
1B～4B	約10億～40億パラメータ	軽くて速い。簡単な会話や要約向き
7B～9B	約70億～90億パラメータ	速度と賢さのバランスがよい
12B～14B	約120億～140億パラメータ	文章力や理解力が上がるが、少し重い
20B～32B	約200億～320億パラメータ	より賢いが、32GBのMacでは余裕が少ない
70B以上	約700億パラメータ以上	高性能だが、大容量メモリが必要

ただし、数字が大きければ必ず使いやすいとは限りません。

大きなモデルを選ぶと、

回答が始まるまで時間がかかる
Macのメモリ使用量が90％を超える
本体が熱くなる
Thinkingが長時間続く
他のアプリまで遅くなる

といったことがあります。

私の32GBのMacで選ぶなら

Mac Studio M1・メモリ32GBの場合は、

用途	おすすめサイズ
初めてローカルLLMを試す	4B前後
普段の会話やブログ作成	8B～12B前後
少し複雑な文章やプログラミング	14B前後
推論性能を重視する	GPT-OSS 20Bなど
27B・30B・32B	動く場合はあるが、快適さは落ちやすい
70B・120B	32GB環境では現実的ではない