Hermes Agentを入れてみた|インストールは簡単。でも設定は意味不明でした(笑)

  • URLをコピーしました!

ollamaからhermes agentをインストールしました。インストール自体は簡単でした。ターミナルから簡単なコマンド一つでできるんだけど・・・その後の設定で固まってしまいました。

目次

ollamaからのインストールはコード一つで

「またターミナルで何個もコマンド打つんだろうな〜」

と思っていました。

ところが実際は…。

コマンド1つだけでした(笑)

ターミナルを開いて、これを入力するだけです。

ollama launch hermes

Enterを押すとダウンロードが始まり、

しばらく待つだけ。

「え?もう終わり?」

って思うくらい簡単でした。

ここまでは順調

インストールも無事に終わり、

「これは余裕だな」

なんて思っていました。

…。

甘かったです(笑)

設定画面を見てフリーズ

Hermes Agentを起動すると、設定画面が出てきました。現在は慣れたけど、初見でこの画面はハードルが高いです

急に難易度が跳ね上がった感じでした。

ここからAI先生の協力で設定していきました

AIに聞きまくる(笑)

ここからは、

ChatGPT先生に聞きまくりでした。

「ここ何を選べばいいの?」

「この設定で合ってる?」

分からないところが出るたびに質問。

本当に先生みたいでした(笑)

ここが焦ったwこれはアプリと繋ぐかって設定なので「Set up later」を選択

少しずつ分かってきた

不思議なもので、

最初は怖い呪文に見えていた英語の設定も、

一つずつ意味が分かってきます。

「なるほど、こういうことか。」

そう思える瞬間が増えてきました。

もちろん全部理解できるわけありませんw

無事設定完了!

次回予告

なんとかHermes Agentの設定も終わり、いよいよ使えるようになりました。

でも実際に使ってみると、

「結局何に使ったらいいの?」

と全く活用できない。

次回は、Hermes Agentを実際に使って感じたことを書こうと思います。


主なローカルLLMの種類と特徴

賢いモデルを使いたくなる私。でもスペックで使えないこともある。

さらに、そのAIによっても得意分野が違うという。種類も多い。何使っていいか今でも全くわかりません。

少しまとめてもらいました。私の環境だとこんな感じだということです。

モデルの種類主な特徴得意なこと主なサイズ快適に動かすメモリの目安Mac Studio M1・32GBでの目安
QwenAlibabaが開発。日本語を含む多言語への対応力が比較的高く、モデルサイズの選択肢も多い日本語の文章作成、要約、プログラミング、考えながら答える作業4B・8B・14B・30B・32Bなど4B:8GB以上8B:12~16GB以上14B:20~24GB以上30B以上:48GB以上推奨8B前後が快適。14Bも使用可能。30B・32Bは動いても待ち時間が長くなりやすい
GemmaGoogleが開発。比較的小型でも文章生成能力が高く、画像を読み取れるモデルもある会話、文章作成、要約、画像の内容説明1B・4B・12B・27B4B:8GB以上12B:16~24GB以上27B:32~48GB以上4B・12Bが使いやすい。27Bはメモリを多く使い、長文では重くなりやすい
GPT-OSSOpenAIが公開した、考える作業を重視したオープンウェイトモデル推論、プログラミング、複数手順の問題解決、ツールを使うAIエージェント20B・120B20B:最低16GB、快適には24~32GB程度120B:約80GB以上20Bは使用可能。ただし長く考える質問では遅くなることがある。120Bは32GBでは難しい
LlamaMetaが開発。対応アプリが多く、ローカルLLMの基本モデルとして広く使われている会話、要約、文章の書き換え、簡単な分類1B・3B・8B・70Bなど1B・3B:8GB程度8B:12~16GB以上70B:64GB以上3B・8Bが快適。日本語ではQwenなどの方が自然に感じる場合がある
MistralフランスのMistral AIが開発。比較的高速で、指示への応答やツール連携にも向いている会話、文章作成、プログラミング、AIエージェント3B・7B・24Bなど7B:12~16GB以上24B:32~48GB以上7B前後は快適。24Bは動作可能でも余裕は少なめ
DeepSeek-R1系答えを出す前に長く考える「推論型」のモデル。小型化された派生モデルもある数学、論理問題、プログラミング、複雑な問題の整理1.5B・7B・8B・14B・32Bなど8B:12~16GB以上14B:20~24GB以上32B:48GB以上推奨8B・14Bは使用可能。ただしThinkingが長く続くことがある

Qwen3には0.6Bから32Bまでの通常モデルに加え、30Bのうち一部だけを動かすMoEモデルも用意されています。 

Gemma 3には1B・4B・12B・27Bがあり、4B以上では最大128Kの長い入力と画像入力に対応しています。 

GPT-OSSには20Bと120Bがあり、OpenAIの公式説明では20Bは16GB、120Bは80GBのメモリで動作可能とされています。 

Llama 3.2の軽量モデルは1Bと3Bで、最大128Kのコンテキストに対応しています。 

Mistral Small 3は24Bモデルとして公開され、会話、指示への応答、プログラミングなどを想定しています。 

DeepSeek-R1には小型の蒸留モデルが用意され、8Bや32Bなどをローカル環境で利用できます。 

サイズ表記の見方

モデル名の横にある「4B」「8B」「27B」などの数字は、基本的にはモデルが持つパラメータ数の大きさを表しています。

表記意味初心者向けのイメージ
1B~4B約10億~40億パラメータ軽くて速い。簡単な会話や要約向き
7B~9B約70億~90億パラメータ速度と賢さのバランスがよい
12B~14B約120億~140億パラメータ文章力や理解力が上がるが、少し重い
20B~32B約200億~320億パラメータより賢いが、32GBのMacでは余裕が少ない
70B以上約700億パラメータ以上高性能だが、大容量メモリが必要

ただし、数字が大きければ必ず使いやすいとは限りません

大きなモデルを選ぶと、

  • 回答が始まるまで時間がかかる
  • Macのメモリ使用量が90%を超える
  • 本体が熱くなる
  • Thinkingが長時間続く
  • 他のアプリまで遅くなる

といったことがあります。

私の32GBのMacで選ぶなら

Mac Studio M1・メモリ32GBの場合は、

用途おすすめサイズ
初めてローカルLLMを試す4B前後
普段の会話やブログ作成8B~12B前後
少し複雑な文章やプログラミング14B前後
推論性能を重視するGPT-OSS 20Bなど
27B・30B・32B動く場合はあるが、快適さは落ちやすい
70B・120B32GB環境では現実的ではない

初心者におすすめの選び方

最初から一番大きなモデルを選ぶよりも、まずは4B~8B程度の軽いモデルから試すのがおすすめのようです。

軽いモデルで正常に動くことを確認してから、

4B → 8B → 12Bまたは14B

という順番で大きくしていくと、自分のMacに合ったモデルを見つけやすくなるそうです。

結局よく使う私がよく使うモデルは「Gemma4:4B」に落ち着きました。

理由は応答が早いからです!!

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次