CPUにおける新しもの信仰を考える ~古いXeonでゲーミング?~
(2022.2/12 E5-2650 v2のスペックデータの誤りを修正)
前置き記事が長くなり過ぎたので先に本編書いちゃおう(笑
手元でリプレースになったXeonワークステーション(サーバーとして使用していた物)が出たのがこのシリーズ書くそもそものきっかけであったりします。
※Xeon(ジーオン)ていうのはIntelのサーバー/ワークステーション向けのCPUです。ワークヘビーな多スレッド動作を要求される場面を想定して設計されていて、Core iが第2世代以降4C8Tをメインライン上位に据えていた時代から上は12C24T/15C30T(世代が上がると18C36Tや24C48Tな物も)等という極めて多コアに振った製品展開をしていました。反面CPUクロックは低めで、シングルコア動作での瞬発力に優れたCPUとは言いがたい特徴を持っています。
コアアーキテクチャそのものは同じなので、Core iブランドでもウルトラハイエンドクラスで同じコアを流用した製品が少種ながら発売されています。
このマシンのスペックはと言うと、
CPU:Xeon E5-2680 v2(10コア最大20スレッド。定格2.8GHz/シングルコアターボMax3.6GHz/オールコアターボMax3.1GHz)x2(=20コア40スレッド)
TDP115w/MTP138w
メモリ:DDR3-1600(PC3-12800)クアッドチャネル(DDR4-3200デュアルチャネルにほぼ相当) 32GB
GPU:GeForce G210
ってところ。
ウーン、何か再利用できないモノかなあ…
と調べているうちにどうやら2018Q3辺りから(なかでも中国やロシア圏やラテン語圏などを中心とした)海外ではXeon使ってゲーミングマシン仕立てるのが流行っているという情報を得ます。
この流行は中国発祥らしく、2018アタマには既に大規模サーバーのリプレースなどで出た大量の旧いXeonが中古で出回るようになってたみたいですね。
特にマルチスレッド性能の高さを生かしてのゲームの実況配信などの入門機として大人気なんだそうです。
ほほう、Xeonがねえ…昔はクロック低めだからゲームには絶対向かないって言われてたんですが。
でもこれはちょっと面白い。
GPUはゲームやるには無謀すぎるので替えるのは必然としてもCPUはどうかなあ??
昨今のゲーム事情を見るに
1.DirectX12やVulkanと言ったゲームの中核技術の一つであるグラフィックスAPIがネイティブマルチスレッド対応になった。
2.Unreal engineのようなゲームエンジンのマルチスレッド最適化がかなり進んでいる。(例えばUnreal engineは特段のアクロバティックなプログラミングを要することなくリニアに12スレッドまでを扱う事が出来る。それ以上のスレッド数の拡張や逆にスレッド数制限を掛けるのに関しては要プログラミングらしい。しかもCPUクロックが3.6GHzより上の領域に入るとエンジン性能の伸びがものすごく悪くなると言われている。※もちろん伸びないわけじゃないので高クロックに越したことはないですが)
等の状況があるんですね。
後、Windows自体もメジャーバージョンを重ねるごとにマルチスレッドの使い方がうまくなっていて、XPなどでは4スレッド以上を効率的に使うのが非常にへたくそだったのですが、7では8スレッド(Homeの場合。これ以上のスレッド数がある場合はProを使う方がパフォーマンスの伸びがよいと言われていました)、10では実質制限なし(とはいえマルチソケット環境だとまだちょっと…な部分はあります)と変化して来ています。
勿論CPUクロックは高いに越したことはないんですが、コア数多ければわりとイケそうな雰囲気。
とは言えE5-2680 v2のコアアーキテクチャ世代はCore i7-4960Xと同じなんで相当に旧式ではあるんですけどね。
よくCPUの性能指標として使われるベンチマークとしてPassMarkというのがあるんですが、それを見るとこんな感じ。
このマシンはCPUを2個積んでいるのでDualのスコアも見てみます。
物理デュアルの性能増加率は大体1.7倍(HTTの論理コアだと1.5倍に欠けると言われます)とされているので若干低めに出ている気がするのだけど、まあこの程度という指標です。
Core i7で近い性能の物を探してみると
Core i7-10700K(8C16T、定格3.8GHz/シングル5.1GHz/オール4.7GHz)が引っ掛かりました。XeonE5-2680 v2のDual構成のCPU総合性能は現在の基準でもそれなりに高めな事が判ります。
※言うて発売当初に2個買うんだと約84万のCPUですけどねE5-2680 v2…Core i7-10700Kは1個で約5万なんで17分の1の価格になります。いやはや。
ただしCore i7-10700Kのシングルスレッド性能が3077ポイントと高くてXeon E5-2680 v2の1766と違い過ぎるのでシングルスレッド性能が近い物を探す事にしましょう。
Core i7-2600K(4C8T、定格3.4GHz/シングル3.8GHz/オール3.5GHz)がヒットしました。シングルスレッドスコアは1741ですね。
他に近いものを探すとCore i5-7400Tが1756ってスコアだけど、末尾T型番は省電力版ですからね~。ほぼほぼノートのそれなんで比較対象としてフェアとは言いがたいです…
というわけで要求されるシングルスレッド性能がCore i7-2600K程度で良くてマルチスレッド最適化されたアプリケーションであればかなり快適に動くという予想が出来ます。
とは言えここまで事細かにシステム要件を提示しているアプリは無いので実地検証しないとホントのところは何もわからないんですけれども。
などと考えていたら実にいいタイミングで知人のGTX1070無印が買い替えで浮くというのでそれを安く譲ってもらう事にします。
譲ってもらったのはこれ。
OC無しのリファレンススペックのショートモデル。後継チップで対抗にあたるのがGTX1660SUPER(レイトレ使いたければRTX2060)という事で2021-22年にあってもFHD環境であれば十分通用する実力の持ち主です。
※というか、中古相場調べたけど箱込み全揃いで状態良ければまだ45000~50000円くらいするのね…2016発売で当時55000円切るくらいで国内流通始まって終売時には48000円くらいの板やぞこいつ。今のグラボ高騰ってホントおかしいわ…
(中古価格は価格は2021.10月末の物。2022.2/8時点では1万円くらい値下がりしました。それでもだいぶ高いよね正直)
経年摩耗で冷却ファンを一度交換に出しているという事でファンの音は結構静か。コイル鳴きも気が付くようなレベルでは無し。状態はかなり綺麗でした。感謝!
グラボ組付けを行ってストレージはSSDに変更してシステムお引越し後、ストレステスト系のベンチを一晩ぶん回して安定性チェックを済ませてからゲームベンチを取りました。
最初に選んだのは比較データをネット上で拾いやすいのとアプリ自体のマルチスレッド最適化率が高いとされている事からFFXVベンチです。
2021年末辺りでも普通に売られているレベルのBTOゲーミングマシン(Core i7-10700F+GTX1660SUPERの構成)でのレビューをネット上で見つけたので御紹介↓
2020冬~2021夏までにかけて販売ランキングトップ3を走り続けたライトミドル級マシンです。
現在は後継機種に替わったのでモデル名が変更されてますが今でも同スペックのBTOマシンが販売中ですね。
で、GTX1070無印を積んだ典型マシンのレビューがこちらのサイト↓(上段サイトのは自作機です)
7700Kオーバークロック+1070無印の組み合わせでスコア6337という結果をネットに上げている方もいたんですが、5GHzにOCしてむしろ300ポイントスコア下がっているのに首をかしげたのでご紹介はしません。
あとYouTubeで海外の人のCore i7-4770K(定格3.5GHz/シングル3.9GHz/オールコア3.7GHz)+GTX1070無印の検証動画も見つけたので貼っておきます↓
こちらではスコア6686をマークしています。
GTX1070のデータでは第4世代、第7世代のCPUを使ってリザルトスコア6600台で推移している所を見ると10700F、7700K、4770KともおそらくGPU側にボトルネックが出てるんだろうと推察できます。
10700F+1660SUPERのスコア6400台なんかはGPUが1070無印に微妙に負けるという結果そのままな感じな気もしますがどうなんですかね?
で、今回のXeonマシンの結果がこちら。↓
ただしこのスコアは若干の設定トリックを施しています。と言っても描画設定下げたりはしていません。
1.UEFI_BIOSでHTT:OFF=20C40T⇒20C20Tに
Xeonでの基本テクニックの一つで、スレッドあたりの処理要求がコア性能を飽和させてしまっている場合に効率の上がってくれないハイパースレッディングによる論理コアを使わず、物理コアのみでのマルチスレッド処理を行わせると言うものです。
コアクロックの低めなXeonですから、ワーク分離のあまり良くないタスクをスレッドに突っ込まれた時のHT処理での性能ペナルティは高クロックCPUに比べて大きいです。論理コア切ってもE5-2680 v2では1CPU辺り10スレッドを扱えますから思い切ってHTTは殺します。
FFXVではフレームレート上限を伸ばすよりレートダウン率を下げて平均フレームレートを向上させる効果がありました。
※HTTを切るとシングルスレッド性能は10%ほど上昇しますが反面マルチスレッドでの総合性能は低下します(大体13~15%位)
この辺はトレードオフなのでシングルスレッド辺りの処理要求がコア性能に対して飽和しないようなら切る必要は無いんですけどね。
2.nVidia設定の3D設定にある「スレッドした最適化」を強制する(ONにする)
特にゲームなどで顕著なのですが、Windowsは単一アプリケーションをマルチスレッド処理する時などに2つ目のCPUを使う事を基本的にしません。
積極的に2CPUを使う為にはアプリケーション側でプログラミングが必要なようです。
しかしGPU側がマルチスレッド処理を自発的に強制して使うようにすると描画前処理段階のCPUタスクの一部がゲームのメインタスクを処理していない側のCPUに投げられるようになるので、ゲーム全体の処理効率が向上します。
この2つの設定を施す前はスコア621x~626xだった(FFXVベンチは下2ケタは結果のばらつきが出るもののようです)のが6634~6682と400ポイントほどの向上が見られたのでこちらを採用しています。
とは言ってもMSI Afterburnerで見てる限りではFFXVベンチのリザルトスコアは上2ケタが平均フレームレート換算できるように表れているみたいなので平均62fpsが平均66fps出るようになったというレベルでしかないですが…
CPUロードが80%超えまでにとどまる状態でGPUロードも95-99%でほぼ安定していたのでGTX1070無印ならこのCPUでも使いきれているという判断で良いと思います。
参考までにFFXIVベンチマークも回してみたんですがFFXVほどには良い結果が出ませんでした。
とは言えFHD最高設定でのオーバー60fps実プレイに支障が出るレベルでは全くないみたいですけどね。4Kモニタとか持ってないので検証してませんが多分WQHDでも行けるでしょう。
FFXIVベンチもマルチスレッド最適化は行っている、というか何なら2CPU全てにタスク/スレッド設定してくれてるんですが、どうもキータスクがスレッドへのワーク振り分けを全て受け持っているらしくてこのキータスク処理をしきらないとスレッド効率が上がらないようなんですね。
単コアにロードがまず集中してそれから各スレッドが仕事を始める感じなので若干フレーム落ち込みが出やすい印象です。後半のグラボ中心のパートでのGPUフルロードもちゃんとするんですがネット上で見るCore i7-10700Kあたりのリザルトと比べるとFFXVベンチ程には互角な気がしません。
ブラッシュアップを繰り返してるとはいえ発売時期が古いのでやはり高クロックCPUの方が向いているゲームなんでしょう。
見立てでととのえたマシンですがわりと目論見通りの性能を発揮したのでまあまあ満足のいく結果が出たかな~?
全然PCゲーマーじゃないのでシリアスPCゲーマーからすると突っ込みどころもあるかと思いますが…
このマシン、実は去年出たWindows(Steam)版アイドルマスタースターリットシーズンのライブストリーミングでのプレイ配信をしていた方にお譲りしてしまい、そちらで第2の人生を歩んでいます。
その方が使っておられたマシンがCore i5-7600K+GTX1060で、OBSのHWエンコード(NVENC)も用いるという状況だったため
「配信外でのプレイには全く支障がないんだけど配信だと全ての動作が非常にきつい。というか配信中にゲームが気絶したまま復帰しない事がある」
という話になっていたので、
a:4C4TなCore i5-7600Kではおそらく根本的にスレッド数が足りてない
b:GPUがゲーム推奨要件に達していないのでリアルタイムエンコまで受け持たせると多分負荷が高すぎる
c:AVX系必須タイトルだからCore i5-7600Kでは下手するとAVXターボクロックモードに入ってCPUクロックが下がってる
と判断し、NVENC用にGTX1050Ti 4GBを追加してお渡しする事にしました。※Xeon E5-x600シリーズはCPU内蔵のPCIeレーン数が40と多いのでPCIe x16+x16をフルで扱えます。x8+x8への分割が不要なのが利点の一つです。
ただし、「あくまでも繋ぎのマシンとして」という念押しはさせていただきました。
Pascal世代のNVENCはTuring世代以降のそれと比べるとどうしても見劣りしますし、RTX型番のGeForceと違ってRTコアが無いのでまともにレイトレーシングやれませんしね。
元々のPCケースは分厚い鉄板で出来ててそれ単体で20kg余裕で越えるガチヘビーなサーバーケースだったので、お安いけど軽いPCケースに中身を丸々お引っ越し後に引き渡しました。
AVXのみでAVX2が無い世代のXeonだったので若干心配しましたが幸い配信もスムーズになってお喜び頂けたようなので何よりでしたね。Unreal engine使ったタイトルなのも奏功しました。
3Dモデリングの習得にも手を出しておられてそちらも快適になったとのこと。まあ元々Xeonが本領発揮する分野ですしねえそっちは。
と、言う訳で、案外イケますよ?Xeonでゲーミング。
マルチタスクに強いのもあって確かに実況配信入門機とかには良いんでしょうね。
あ、メルカリとかでこの世代とかちょっとだけ後の世代のXeonマシンをゲーミングPCと称して売っていたりするようですが、「今どきのゲームも結構出来ちゃうもんだなあ」ってだけなのでやめときましょうね?
CPUの総合性能高いと言ってもマルチスレッド最適化甘いとコアクロックがモノ言うのは事実ですし、GPUもGTX10xx世代より前の奴(と言っても980Tiクラスまで行けば使えなくはないのですが…)やらGT1030やらGTX1050無印付けられてもわりとどうにもなんないので。
少なくともやたらとゲーミングPC名乗るのは詐欺だと言われても仕方ない。
Xeon E3系のCPUはまんまCore i7の流用な4C8Tという面があってアーキテクチャ世代とクロック数を突き合わせるだけなので性能的にもわかりやすいんですが、E5系、E7系は低クロック多コア構成なCPUパッケージが多いのでPassMark総合値だけで同等ってわけにはいきませんからね。
悪質な売り手だと、今回のE5-2680 v2の弟分に当たるE5-2650 v2(8C16T、定格2.6GHz/シングルコアターボ3.4GHz/オールコア3GHz)をCore i7-7700K (4C8T、定格4.2GHz/シングル4.5GHz/オールコア4.4GHz)と同等!とか書いてたりしてタチ悪すぎなんだがコイツってなりましたマジで。
PassMark総合値は同程度でも7700Kと同じつもりでマイクラみたいなCPUクロック依存度極振りなゲームやったら死ねるだろうがよ。こんなん買っちゃいけません。
次回はゲーミングPCの定義の確認記事の続きか、Xeonでゲーミングの補足記事か…
それではまた次の記事で。