ローカルLLMに１８トークン／秒は遅いかと聞いてみた。 | bdynFGのブログ

シンプルブログ

bdynFGのブログ

ローカルLLMに１８トークン／秒は遅いかと聞いてみた。

公開 2026/02/23 10:46

最終更新 -

NVIDIA製Nemotron-Nano-9b-v2に聞いてみた。
Xeon W-2125/Quadro P5000(16GB)搭載機でNemotron-Nano-9b-Japanese(Q4-K-S)、LM Studioから聞いてみた。

NVIDIAってどんな企業？　内容はともかく17.75トークン／秒と出た。
これって遅い？って聞いたら、NVIDIAの基準から言えば許容範囲外で遅いって。まあ、わかるが。

参考にもならないが、Core i7-9700/Geforce RTX3050(6GB)搭載機で同様の問い合わせを試したら、7.79トークン／秒だった。ま、Nemotron-Nano-9b-Japanese(Q4-K-S)でも、6Gを超える容量なので、GPU のメモリに収まり切れなかった問題もあるのだろうし、3050自体が速くないしな。
同機でQwen3-4b-instruct-2507は49.29トークン／秒、Thinkingを使わないせいか結構早い。

no name

プロフィールページ

最近の記事

AI比較：GeminiとCopilot、ChatGPT、Claude甲乙つけがたい

ちょっと遠出のドライブプラン（ルートと休憩２回）を作成させてみた。詳細は省くけど、印象としては、Gemini/Copilot/ChatGP…

2026/03/17 10:48

訃報：池田昌子さん（享年87）

あまりこういうことは残したくないんだけれども、この方のことは覚えていたい。３月３日永眠。合掌。でも、割と往生だった…

2026/03/13 16:51

いわゆる非公式アップグレード

DELLのInspiron 15 3525。個人的には十分高性能で、十分使えるのにと思っていたんだけれども、やむを得ない事情でリプレースし…

2026/03/12 09:46

CarbonOS on Redmi Note 5

ちょっと、昔のスマホを引っ張り出してきた。 UnofficialなFirmwareが入らないかと思って。使えそうなら、カメラとか専用機と…

2026/03/07 11:56

AI．．．こそっと間違いを入れるのは困る。

「与えた表面積の値を利用して、ニッケルメッキの重量を求めよ。」２問、問い合わせたところ、２つ目が異常に小さい結果にな…

2026/03/04 16:38

永代供養．．．事実上の無縁仏だなぁ

昨日、叔父の火葬を行ってきた。本日、お骨を近所の葬祭ホールとの契約で樹木葬してくるとのこと。叔父は財産もなく、妻…

2026/02/26 11:20

ローカルLLMに１８トークン／秒は遅いかと聞いてみた。

NVIDIA製Nemotron-Nano-9b-v2に聞いてみた。 Xeon W-2125/Quadro P5000(16GB)搭載機でNemotron-Nano-9b-Japanese(Q4-K-S)、LM …

2026/02/23 10:46

社内で古いノートPCをゲット

Windows11へのリプレースは順調とか言っても、Windows10からのアップグレードでそれなりに利用できていたパソコンはそのままに…

2026/02/18 09:43

antigravity: Gemini3 Flashでいいんじゃないか？

antigravityで、コーディング以外にもいろいろな仕事を任せられることがわかって、日々使っているとGemini3 ProだとLowでもHigh…

2026/02/17 13:43

自分の中で固まっていないことをやろうとすると困る

課金していても、一番低い料金だと、やはり使えるトークンが少ない。やりたいことがAIに伝わらないとき、試行回数が増える。 …

2026/02/13 14:51

選挙結果をAIに総括させてみた。

履歴の続きを利用して、「過去の予想を踏まえて総括してください。」と問い合わせてみた。結果、履歴内容を踏まえてきちん…

2026/02/13 09:19

おそらくこれがサブスク（Google AI Plus）の恩恵

Google AI Plusに課金して、はじめてAntigravityを使用した時。おお、これが課金した効果かと感じた。無課金のとき、Anti…

2026/02/11 08:44

Google AI Plusに乗り換えた

Googleのクラウドストレージサービス(Google Drive)を増量するだけの名目でGoogle One(月額290円)に加入していたのだけれども、…

2026/01/29 09:22

旧PCでLinuxは動くが．．．（というよりCore i3の罠？）

ZorinOS18、若干貧弱なPCでも快適に使えるので、結構重宝しているんだけれども、環境を整えて本格的に使おうとしたら挫折した話…

2026/01/27 08:43

AIに議席数予測させてみた：2026年衆院選

今回はFelo、Gemini(Gemini3 Fast)、Gemini Deep Research(Gemini3 Fast)、Perplexity。ただし、中道改革連合の支持率が出て…

2026/01/22 16:41

これは確かに不満が出るわ。Inspiron 15 3525

なんか、使っている人が不満そうなんだけど、どう不満なのか言えないみたいな微妙なパソコン。でも、ちょっと触ってみて、…

2026/01/20 17:52

ちょっと困っていた問題が解決した話

pythonを使ってRPA的な処理を作成しようとするとき、重宝するのがSelenium。 2025年7月頃から困ってたことが、最新リリース向…

2026/01/13 13:57

Ctrl+Wが恨めしいと思った日

社長が使わなくなったからってHHKB Professional Hybridをくれた。（ちなみに社長はHHKB Studio（墨）を使ってる。キートップ…

2026/01/13 12:07

ZorinOSを入れてみた

Chrome OS Flexを旧型PCに入れていたんだけど、どうもデスクトップがすっきりし過ぎて落ち着かない。いや、汚いのが良いとは…

2025/12/19 14:24

マイクロソフトは劣化が著しい

新しいパソコンが届いたのでセットアップしようとして、サーバ上の共有フォルダを開こうとしたら、「拡張エラー」？？？エ…

2025/12/16 11:29

もっと見る

タグ

アニメ（2）

ChatGPTで遊ぶ（1）

Windows11（1）

自動処理（1）

もっと見る

同一カテゴリーブログの新着記事

1900年4月4日　明治33年【内　閣】第2次山縣有朋内閣総理　山縣有朋／外務　青木周蔵／内務　西郷従道／大蔵　松方正義／陸軍　桂太郎／海軍　山本権兵衛／司法　清浦奎吾／文部　樺山資紀／農商務　曾禰荒助…

大森博子のブログ

Posted by 大森博子

Explore the Possession Details of Mantra Upcoming Project in Sus

Are you searching for a new home in Pune? You want good value for your money. You also want a trusted developer. Mantra Sus fits this need perfectly. This upcoming project brings modern living to Sus…

McGMHvのブログ

Posted by no name

歯医者が最も少ない都道府県は？

歯科医師の数は地域によって大きく差があり、その中でも特に少ないとされているのが鳥取県だ。鳥取県は全国で最も人口が少ない県として知られており、人口規模が小さいことが歯科医師数にも影響している。歯科医院…

歯医者での診察時に感じた安心感

Posted by no name

地雷の啓発デーに思う

今日は、地雷に関する啓発および地雷除去支援のための国際デーだった。これに関連して、AIに絵を描いてもらった。その絵は、私の期待を超える出来栄えだった。光輝く何かが描かれていて、まるで希望の象徴のよ…

iPkrVEのブログ

Posted by 津ゥーYG

星にときめく　6－②

６　－② 大学生になって初めて、所謂「デート」に挑んだ男の胸中が想像できようか。選んだ相手は理想とは異なって当然のこと（その頃は女優の内藤洋子が理想像だった）、向こうが自分を離してくれなくてと言い訳…

Posted by 赤烏帽子

【仕事】上司と会ってきた話

休職の診断書原本を会社に提出する必要があったので、久しぶりに上司と会ってお昼ごはんを食べてきた。休職中の職場の様子などをいろいろ聞いたところ、クライアントのメンタルクラッシャーお姉さんも、もう一…

テツ子の小部屋（改）

Posted by ちゃおこ

シンプルブログをはじめよう

複雑な時代だからこそ
シンプルなブログをはじめてみませんか？

簡単に無料ではじめられます。

はじめる（無料）