llamaをローカルPCで使ってみた
公開 2023/09/12 12:04
最終更新 2023/09/12 15:28
Open Interpreterというものを使ってみたいと考え、使い方を紹介してくれているサイトを参考にインストールを試していたのだけれども、ChatGPT-4を利用するのは嫌(というか、お金が惜しい)なので、Metaから提供されているLlamaを使う方法を採用。

結果、どうやってもうまくいかないなぁ、と。

とりあえず、Llamaというものを使ってみようということで、llama.cppをダウンロード、あ、これはコンパイルしなきゃダメか。ということで、makeしてみました。

参考にしているサイト通り実行してみるも、モデルを読み込めない。(モデルはHugging Faceからダウンロードしてきたもの。"llama-2-7b-chat.ggmlv3.q4_K_M.bin")
一度も使ったことがないと何が悪くてダメなのかわからないのがつらいですね。
結局のところ、今のllama.cppはggml形式のモデルは使えなくて、gguf形式に変換する必要があるとのこと。変換ツールもllama.cppについていますし、Hugging Faceにgguf形式のモデルも掲載されています。
lliama.cppでは8月以降、仕様変更が実施されたようで、参考にした7月半ばの記事ではカバーされていなかったというお話。この業界、わずかなタイミングの差で状況が変わりますから、面倒ですね。
(本業だったら、髪をかきむしるようなお話。いや、私程度だったらLlamaがどうのとかいう仕事はまわってこないか。業界から足を洗って15年もたっているので、仮定のネタにもなりません。)

さて、原因は分かったところでいくつかサンプルを試してみるに最初の一回目がとても遅いのと、二回目以降も遅いのが気になりました。
一回目の遅い理由は、モデルを読み込むのに時間がかかっているんだなとは思います。モデル(ggufファイル)だけでも5GBとかありますからねぇ。HDDにおいてあるので、やむなしかなと。
で、二回目以降というのは一回目ほど遅くはないんですが、どうもGPUを使っていないような気が。

深く考えずmakeするとGPUを使わないかたちになるんですね。

落ち着いてcuBLASを利用するようにmake仕直したら、GPUを使うようになりましたが劇的に変わったという感じにはなりませんでした。数割増しくらい?こんなもんなんでしょうかね。
CPU負荷は気持ち軽くなったかも。

さて、llamaについて少しは理解したところで、Open Interpreterを...やっぱりよくわかりません。
でも、便利そうなんですよねぇ。もうちょっと頑張ってみるか。
最近の記事
AI比較:GeminiとCopilot、ChatGPT、Claude甲乙つけがたい
ちょっと遠出のドライブプラン(ルートと休憩2回)を作成させてみた。 詳細は省くけど、印象としては、Gemini/Copilot/ChatGP…
2026/03/17 10:48
訃報:池田昌子さん(享年87)
あまりこういうことは残したくないんだけれども、この方のことは覚えていたい。 3月3日永眠。合掌。 でも、割と往生だった…
2026/03/13 16:51
いわゆる非公式アップグレード
DELLのInspiron 15 3525。個人的には十分高性能で、十分使えるのにと思っていたんだけれども、やむを得ない事情でリプレースし…
2026/03/12 09:46
CarbonOS on Redmi Note 5
ちょっと、昔のスマホを引っ張り出してきた。 UnofficialなFirmwareが入らないかと思って。使えそうなら、カメラとか専用機と…
2026/03/07 11:56
AI...こそっと間違いを入れるのは困る。
「与えた表面積の値を利用して、ニッケルメッキの重量を求めよ。」 2問、問い合わせたところ、2つ目が異常に小さい結果にな…
2026/03/04 16:38
永代供養...事実上の無縁仏だなぁ
昨日、叔父の火葬を行ってきた。 本日、お骨を近所の葬祭ホールとの契約で樹木葬してくるとのこと。 叔父は財産もなく、妻…
2026/02/26 11:20
ローカルLLMに18トークン/秒は遅いかと聞いてみた。
NVIDIA製Nemotron-Nano-9b-v2に聞いてみた。 Xeon W-2125/Quadro P5000(16GB)搭載機でNemotron-Nano-9b-Japanese(Q4-K-S)、LM …
2026/02/23 10:46
社内で古いノートPCをゲット
Windows11へのリプレースは順調とか言っても、Windows10からのアップグレードでそれなりに利用できていたパソコンはそのままに…
2026/02/18 09:43
antigravity: Gemini3 Flashでいいんじゃないか?
antigravityで、コーディング以外にもいろいろな仕事を任せられることがわかって、日々使っているとGemini3 ProだとLowでもHigh…
2026/02/17 13:43
自分の中で固まっていないことをやろうとすると困る
課金していても、一番低い料金だと、やはり使えるトークンが少ない。 やりたいことがAIに伝わらないとき、試行回数が増える。 …
2026/02/13 14:51
選挙結果をAIに総括させてみた。
履歴の続きを利用して、「過去の予想を踏まえて総括してください。」と問い合わせてみた。 結果、履歴内容を踏まえてきちん…
2026/02/13 09:19
おそらくこれがサブスク(Google AI Plus)の恩恵
Google AI Plusに課金して、はじめてAntigravityを使用した時。 おお、これが課金した効果かと感じた。 無課金のとき、Anti…
2026/02/11 08:44
Google AI Plusに乗り換えた
Googleのクラウドストレージサービス(Google Drive)を増量するだけの名目でGoogle One(月額290円)に加入していたのだけれども、…
2026/01/29 09:22
旧PCでLinuxは動くが...(というよりCore i3の罠?)
ZorinOS18、若干貧弱なPCでも快適に使えるので、結構重宝しているんだけれども、環境を整えて本格的に使おうとしたら挫折した話…
2026/01/27 08:43
AIに議席数予測させてみた:2026年衆院選
今回はFelo、Gemini(Gemini3 Fast)、Gemini Deep Research(Gemini3 Fast)、Perplexity。 ただし、中道改革連合の支持率が出て…
2026/01/22 16:41
これは確かに不満が出るわ。Inspiron 15 3525
なんか、使っている人が不満そうなんだけど、どう不満なのか言えないみたいな微妙なパソコン。 でも、ちょっと触ってみて、…
2026/01/20 17:52
ちょっと困っていた問題が解決した話
pythonを使ってRPA的な処理を作成しようとするとき、重宝するのがSelenium。 2025年7月頃から困ってたことが、最新リリース向…
2026/01/13 13:57
Ctrl+Wが恨めしいと思った日
社長が使わなくなったからってHHKB Professional Hybridをくれた。 (ちなみに社長はHHKB Studio(墨)を使ってる。キートップ…
2026/01/13 12:07
ZorinOSを入れてみた
Chrome OS Flexを旧型PCに入れていたんだけど、どうもデスクトップがすっきりし過ぎて落ち着かない。 いや、汚いのが良いとは…
2025/12/19 14:24
マイクロソフトは劣化が著しい
新しいパソコンが届いたのでセットアップしようとして、サーバ上の共有フォルダを開こうとしたら、「拡張エラー」??? エ…
2025/12/16 11:29
もっと見る
タグ
AI(39)
IT(20)
雑感(8)
IoT(6)
AI,(5)
IT,(5)
愚痴(5)
日記(3)
RPA(2)
アニメ(2)
ChatGPTで遊ぶ(1)
Windows11(1)
自動処理(1)
もっと見る