Core i7 CPU の評価レポート

2008-12-30

Core i7 は Intel の Core 2 の後継となる CPU です。Core i7 を購入したので、それについていろいろ調べていきます。

目次

クリックすると、ページ内ジャンプします。

  1. 概要 - Core 2 と Core i7 の違い
  2. 今回使用するパーツの紹介
  3. 組み立て
  4. クアッドコア x Hyper Threading
  5. ターボモードを検証する
  6. オーバークロック
  7. ベンチマークテスト - Pentium 4, Core 2 Duo との比較
  8. 消費電力
  9. 結論

1. 概要 - Core 2 と Core i7 の違い

長く続いたシステムアーキテクチャに変化

Core i7 の CPU コアは Core 2 に拡張を加えたものとなっています。しかしその拡張は小規模ではなく、マザーボードを含めたシステムアーキテクチャにも影響を与える変更となっています。

図はシステムアーキテクチャの違いを示したものです。左が Core 2 のシステム、そして右が Core i7 のシステムです。左の図は Core 2 だけではなく、Pentium 時代から続くものです。FSB は高速になったし、グラフィックスは AGP から PCI Express に変わるなどの変化はありましたが、基本の接続図は変わっていません。しかし今回、Core i7 によってこの図が変わります。

変わったのはメモリの接続先です。従来は P965、P35、P45 といったノースブリッジにメモリコントローラが内蔵されており、ここへ接続されていました。しかし Core i7 では、CPU 本体にメモリコントローラが内蔵されており、ノースブリッジを経由せず、CPU が直接メモリと接続します。これによってアクセスレイテンシ (遅延) が小さくなります。Core i7 では 3 チャンネルの DDR3 メモリコントローラが内蔵されています。メモリを 3 枚単位で取り付けると、最高のパフォーマンスが得られます。

メモリが CPU と直結されることによって、従来の FSB は廃止されました。ノースブリッジである X58 との接続には QPI (QuickPath Interconnect) と呼ばれるインターコネクトが使用されます。

CPU の違いのまとめ

Core 2 と Core i7 の CPU 本体の違いは下の表にまとめました。

項目Core 2 DuoCore 2 QuadCore i7
リリース時期2006 年 8 月2007 年 1 月2008 年 11 月
製造プロセス65 nm / 45 nm65 nm / 45 nm45 nm
最大周波数3.33 GHz3.20 GHz3.20 GHz
CPU コア数244
コアあたりの実行スレッド数
(Hyper Threading)
112
合計の実行スレッド数
(CPU コア数 x Hyper Threading)
248
L1 キャッシュコアごとに 32+32 KBコアごとに 32+32 KBコアごとに 32+32 KB
L2 キャッシュすべてのコアで共有する 2-6 MB2 コアごとに共有する 2-6 MB x 2コアごとに 256 KB
L3 キャッシュ(なし)(なし)すべてのコアで共有する 8 MB
外部バスFSB 800-1,333 MHz
(6.4-10.6 GB/s)
FSB 1,066-1,600 MHz
(8.5-12.8 GB/s)
QPI 4.8-6.4 GT/s
(19.2-25.6 GB/s)
メモリコントローラ2-channel DDR2/DDR3
(ノースブリッジに内蔵)
2-channel DDR2/DDR3
(ノースブリッジに内蔵)
3-channel DDR3
(CPU に内蔵)
拡張命令SSE 3
SSE 4 (45 nm 版のみ)
SSE 3
SSE 4 (45 nm 版のみ)
SSE 4.2
ターボモード××
64 bit 対応
TDP65 W95-130 W130 W
パッケージLGA 775LGA 775LGA 1366

3 層になったキャッシュ階層

まず異なるのは内蔵キャッシュです。Core 2 では L1 と L2 の 2 階層キャッシュになっているのに対し、Core i7 では L1、L2、L3 の 3 階層キャッシュになっています。これは、キャッシュの容量が大きくなっていくとアクセスレイテンシが増大するためだそうです。増大するレイテンシを抑えるために、従来の L1 と L2 の中間に L1.5 相当のキャッシュ階層を挟んであります。

追加されたキャッシュ階層はコアごとに保持される 256 KB のキャシュです。また、8 MB の L3 キャッシュはすべてのコアがアクセス可能な共有キャッシュです。

Hyper Threading が復活

Pentium 4 に搭載された SMT 技術「Hyper Threading」が再び搭載されました。1 つのコアが 2 つのスレッドを同時に処理することができます。Core i7 はクアッドコア CPU なので、CPU 1 個で 8 スレッドを同時実行できます。

3-channel の DDR3 メモリコントローラ

先に述べたように、Core i7 には DDR3 メモリコントローラが内蔵されています。DDR2 メモリは使用できません。そして 3-channel 接続ですので、メモリは 3 枚単位で増設するのが基本です。しかし必ず 3 枚単位で取り付けなければならないわけではなく、1 枚や 2 枚でも動作します。1 枚や 2 枚にしても、わずかに性能低下するだけです。大抵のマザーボードでは 6 スロット用意されているようです。

3-channel となると、マザーボードの配線が複雑になるため、基盤を構成する層を増やさなければなりません。よって、マザーボードの価格が高くなります。

シングルスレッド性能を加速するターボモード

Intel Turbo Boost Technology が搭載されています。TDP に余裕がある場合、その範囲内で特定の CPU コアの動作倍率を引き上げ、シングルスレッド性能を向上させるという技術です。これについてはあとで単独で検証します。

より進んだ電力管理

増大する消費電力を抑えるために改良が加えられています。Integrated Power Gate はアイドル状態の (使用されていない) CPU コアの電源を完全にオフにすることで、消費電力をゼロにすることができます。CPU コアが増えるほどアイドル状態にある CPU コアもまた増えることになりますので、その意味でこの技術は非常に重要です。また、この動作はオペレーティングシステムのサポートを必要としません。

TDP はデスクトップ用の上限となる 130 W

TDP は 130 W と非常に高いです。TDP とは、それだけの熱が発生するので、ケースにそれだけの熱を廃熱する能力を持たせなければならないことを示す基準値です。TDP が大きくなるほど最大消費電力と最大発熱量が増えることを意味します。

2. 今回使用するパーツの紹介

今回使用する主なパーツをご紹介します。

P6T Deluxe

マザーボードは ASUS の P6T Deluxe です。すでに述べたように、3-channel メモリを安定して接続するために、通常よりも層が多く作られており、そのため価格が高くなっています。¥36,620。現在かなりの円高ですので、もし円高でなければ 4 万円台中盤から後半で販売されていたかも知れません。

左はマザーボードの全景写真です。高解像度でご覧いただけます。

メモリスロットは CPU に近い方から 1,2,1,2,1,2 となっておらず、2,1,2,1,2,1 となっていますので注意してください。つまり、オレンジのスロットを先に埋めるようにします。

マザーボード上に電源スイッチとリセットスイッチが設置されています (写真左下)。動作確認する場合に非常に便利です。

PCI Express x16 スロットが 3 本あり、NVIDIA の SLI に対応します。X58 チップセットは、Intel チップセットでは初めての SLI 対応です。マザーボードに SLI ブリッジが付属します。

SAS コントローラがオンボードで搭載されており、SAS ハードディスクを使用することができます。SAS は SATA に下位互換性があるので、SAS コントローラに SATA ハードディスクを接続することもできます。しかし SAS コントローラが有効だと、BIOS の起動にかなり時間がかかるため、使用しない場合は無効にしておくのがよいでしょう。


メモリスロットと CPU ソケットが結線されていることに注目してください。従来はメモリスロットとノースブリッジが接続されていました。左下の写真を見ると、かなり芸術的な配線ですね。

それから、最後の写真 LGA 1366 に注目してください。LGA 775 と比較するとソケットの大きさが一回り大きなものになっていますが、ピンの数がほぼ倍増しています。そのためピンがより細くなっており、より高密度に配置されています。わずかな衝撃でもピンを曲げてしまうおそれがあります。取扱いには細心の注意を払ってください。

Core i7 920

CPU は Core i7 の中でもっとも安い 920 です。¥28,970。LGA 775 の CPU と比較すると一回り大きいです。

S-Spec は SLBCH、産地は COSTA RICA と刻印されています。スペックは以下の通り。

DDR3-1333 2GB x 3

CFD 販売の T3U1333Q-2G です。DDR3-1333 (PC3-10600) 2 GB の 3 枚組で、合計 6 GB となっています。CL は 9。チップは elixir 選別品とのこと。価格は ¥18,220。

Core i7 で使用するメモリは電圧が 1.5 V のものを使用してください。DDR3 の中にはデフォルトで高い電圧のメモリがありますが、それを使用しますとメモリコントローラを CPU に内蔵した関係で CPU が損傷する危険があります。Core i7 対応を謳っている製品を選びましょう。

これを 2 セット買って 12 GB にしようかという思惑もあったのですが、DDR3 はここからが普及フェーズであるため、価格が大幅下落する余地があります。来年 1 年間で大幅に下落すると思われますので、今は 6 GB にしておきます。12 GB の必要性も特にありませんし。

32 bit の Windows Vista や 32 bit の Windows XP は、どんなに物理メモリを搭載しても最大 3 GB 程度しか認識できません。3 GB 以上を使用したい場合は 64 bit の Windows Vista または 64 bit の Windows XP を使用してください。

MUGEN 2

Core i7 の TDP は 130 W です。130 W という数値はデスクトップ用 CPU としては上限値です。これはつまり、発熱と消費電力が非常に高いことを意味します。この熱を冷却するだけの強力な冷却装置が必要です。そのためにサイズの MUGEN 2 を用意しました。

Core i7 のリテールクーラーと MUGEN 2 の比較です。この体積とヒートパイプの本数から、冷却能力は高そうです。

MUGEN 2 を取り付ける際には、マザーボードに最初から設置されているバックプレートを交換する必要があります。また、クーラーを取り付ける際、クーラーをマザーボードに乗せた状態で、マザーボード裏面からのネジ止めがあり、ひとりでおこなうにはかなり難しい作業です。誰かに手伝ってもらいましょう。取り付けやすさが改善すればよいクーラーなのですが…。

パーツまとめ

その他のパーツも含めて表にまとめました。ほかのパーツはそれほど新しいものではありません。

項目名称
マザーボードASUS P6T Deluxe
CPUIntel Core i7 920
CPU クーラーMUGEN 2
メモリDDR3-1333 2GB x 3
グラフィックスカードLeadtek GeForce 9600 GT 512 MB
ストレージSeagate ST31000333AS (1 TB)
光学ドライブPioneer DVR-S12J
電源Seasonic SS-600HM

3. 組み立て

組み立てた図。組み立てたと言っても、動作確認するためにケースにはまだ入れません。

クーラーの巨大さが異様な雰囲気を漂わせています。

続いてオペレーティングシステムをインストールしました。Windows Vista Ultimate の 64 bit 版です。下は Windows のタスクマネージャ。8 つの論理 CPU が正しく認識されています。

そして Windows エクスペリエンスインデックス。すべての項目で最大値 5.9 を獲得しました。

4. クアッドコア x Hyper Threading

Core i7 はクアッドコア CPU (4 コア CPU) です。そこへ Hyper Threading が追加されています。各コアが 2 個の論理 CPU として認識されますので、合計で 8 個の CPU が認識されます。

1 個のコアで 2 スレッドを実行する場合、Hyper Threading を有効にすることで最大 30 % 性能が向上するとされています。物理的なデュアルコアで 2 スレッドを実行すると 80-100% の性能向上になりますから、物理的なデュアルコアに比べるとかなり性能は劣るものの、増加するダイサイズの割に大きな性能向上が見込めるということで、実装されています。

パフォーマンスでの懸念事項

Hyper Threading における懸念事項が存在します。たとえば Core i7 で 2 スレッドを実行させる場合、オペレーティングシステムがどの CPU に割り当てるかで性能が変わる可能性があります。というのは、物理的に異なっている CPU ならば高い性能が期待できますが、物理的に同じ CPU にスケジューリングしてしまうと、性能が落ちてしまいます。

オペレーティングシステムが Hyper Threading のことをよくわかっていて、同じ物理コアにスケジューリングしないようにしてくれればよいのですが、はっきりとわかりません。まずは、どの論理 CPU とどの論理 CPU が、物理的に同じ CPU なのかを調べてみます。

プロセスが使用する CPU を限定する

Windows のタスクマネージャには、あるプロセスをどの CPU で実行するかを設定する機能があります。タスクマネージャの「プロセス」タブを開き、設定したいプロセスを右クリックし、「関係の設定」を選択します。すると下のような画面が開きます。

ここで、このプロセスを実行する CPU を選択することができます。CPU 0 と CPU 1 でだけ実行させたい場合は、このふたつだけをチェックして「OK」で閉じます。

通常はスレッドスケジューリングはオペレーティングシステムにすべて任せておけばよいので、この機能は使用する必要はありませんが、性能分析する場合などに利用できます。

タスクマネージャを使用してどの論理 CPU がペアなのかを見分ける

タスクマネージャの関係の設定を使って、論理 CPU のペアを探します。アプリケーションは Tripcode Explorer を使用します。関係の設定で 8 個の論理 CPU の中から 2 個だけを選択し、その性能を測定します。選択する論理 CPU を変化させながら、いろいろな組み合わせで実行してみます。物理コアが違っていれば高い性能が出るはずですし、物理コアが同じならばそれほど高い性能は出ないはずです。性能が高ければ「高」、それよりも低いときは「低」として表を作成してみます。調査結果は下のようです。

CPU 0CPU 1CPU 2CPU 3CPU 4CPU 5CPU 6CPU 7
CPU 0-
CPU 1-
CPU 2-
CPU 3-
CPU 4-
CPU 5-
CPU 6-
CPU 7-

すべての組み合わせで調べたわけではありませんが、このような結果で間違いありません。

つまり、CPU 0 と CPU 1 がペア、CPU 2 と CPU 3 がペア、CPU 4 と CPU 5 がペア、CPU 6 と CPU 7 がペアで物理コアが構成されているようですね。つまり、タスクマネージャでの表示と実際のレイアウトは下の図のようになっています。

結果としては、そのままです (笑)。ネット上ではレイアウトが 0, 2, 4, 6, 1, 3, 5, 7 になっているという話もあったので調べてみたのですが、素直に配置されています。ただ、環境によって異なる可能性がありますし、タスクマネージャがモニタリングしている CPU が常に同一であるという確信もありません。

5. ターボモードを検証する

6. オーバークロック

Core i7 のオーバークロックを試します。

オーバークロックはメーカーの保証外の動作です。オーバークロックによってパーツや周辺機器が故障したとき、保証が受けられないことがあります。また、専門的な知識が必要ですので、安易におこなわないでください。オーバークロックによって問題が発生しても、当サイトは責任を負えません。

Core i7 はマザーボードのベースクロックの倍数で動作します。この点では従来の CPU と同じです。たとえば Core i7 920 (2.66 GHz) はベースクロック 133 MHz の倍率 20 ですし、Core i7 Extreme 965 (3.20 GHz) はベースクロック 133 MHz の倍率 24 です。すなわち、ベースクロックを引き上げるか、または倍率を引き上げれば周波数が上がります。

倍率は Core i7 Extreme では自由に変更できますが、Extreme 以外の Core i7 では規定値より高くは設定できません。Core i7 920 は既定の倍率が 20 なので、21 以上には変更できません。12-20 のあいだで変更可能でした。したがって、オーバークロックをするには、Extreme 以外ですとベースクロックを引き上げるしかありません。

倍率を上げる方法に比べると、ベースクロックを上げる方法は難易度が高くなります。なぜなら、ベースクロックはマザーボード上のあらゆるオンボードデバイスの周波数の基準となっており、ベースクロックを上げることによってそれらのデバイスの周波数も上がってしまうからです。Core i7 の場合、ベースクロックを上げると CPU 周波数は上がりますが、同時にメモリの周波数や QPI 周波数も上がってしまいます。そして CPU よりもこれらがボトルネックになるシーンが出てしまいます。それを防ぐためにメモリや QPI の倍率を下げたり、いろいろな電圧を上げたりして回避することができます。

今回、単にベースクロック (BCLK) を引き上げていきました。VCore を Auto にしておくとそれだけで 190 x 20 で 3.80 GHz 動作しました。ただしこのとき VCore が 1.40 V 付近でかなり高くなっていましたので、手動で 1.30 V にしたところ、それでも問題ありませんでした。Tripcode Explorer で 8 スレッドに負荷をかけても、落ちません。続いて 4 GHz にトライしたのですが、1.35 V かけても Tripcode Explorer で落ちます。1.30 V から 1.35 V までほとんど変化がないことから、おそらく VCore 以外の電圧 (アンコア電圧、QPI 電圧) などがボトルネックになっている可能性もあります。

下はなんとか 4 GHz で動いている様子。Core Speed は 4000.1 MHz と表示されています。

4 GHz で CPU が 100% のときの消費電力がすごいです (^_^; 4 GHz での常用は不可能です。VCore 以外の電圧をチューニングすれば動く可能性はありますが、消費電力と温度が尋常ではないため、当たり石でも 4 GHz 常用はかなり厳しいでしょう。おそらく 1.20 V くらいの VCore で 4 GHz が動いたとしても、消費電力と発熱はかなりのものです。

7. ベンチマークテスト - Pentium 4, Core 2 Duo との比較

テストセットアップ

Core i7 の性能を評価します。手元にあった Pentium 4 と Core 2 Duo と比較します。幸いにも、Pentium 4 は 64 bit 対応版でしたので、オペレーティングシステムを Windows Vista の 64 bit バージョンで統一します。

今後はゆっくりではありますが、徐々に 64 bit へ移行が進みます。大容量のメモリが非常に安価になっていますから、この流れは止められません。こういった事情を考慮し、64 bit バージョンでのテストとしました。ご理解いただければと思います。

項目Pentium 4 マシンCore 2 Duo マシンCore i7 マシン
CPUPentium 4 630Core 2 Duo E6600Core i7 920
CPU コードPrescott 2MConroeBloomfield
CPU 製造プロセス90 nm65 nm45 nm
CPU パッケージLGA 775LGA 775LGA 1366
CPU 周波数3 GHz (デフォルト)2.40 GHz (デフォルト)
3 GHz (オーバークロック)
2.66 GHz (デフォルト)
3 GHz (オーバークロック)
4 GHz (オーバークロック)
CPU コア数124
CPU Hyper Threading212
CPU 同時実行スレッド数228
CPU L2 キャッシュ2 MB4 MB256 KB/Core
CPU L3 キャッシュ(なし)(なし)8 MB
CPU 外部バス800 MHz FSB1,066 MHz FSB4.8 GT/s QPI
CPU TDP84 W65 W130 W
マザーボードP5P800
i865P + ICH5
P5B Deluxe WiFi-AP
P965 + ICH8R
P6T Deluxe
X58 + ICH10R
メモリDDR-400 512 MB x 4DDR2-667 1 GB x 4DDR3-1333 2 GB x 3
グラフィックスカードGeForce4 MX 4000 (64 MB)GeForce 9600 GT (512 MB)
GeForce Driver 180.48
ストレージSeagate ST31000333AS (1 TB)
オペレーティングシステムWindows Vista Ultimate 64 bit Service Pack 1

Windows Vista でベンチマークテストをする場合に気をつけなければならないのは、検索インデックス作成処理や SuperFetch のサービスです。これらのサービスは性能に影響をきたしますので、あらかじめ停止しておきます。

なお、上記 3 構成はメモリ容量が 2 GB、4 GB、6 GB と異なっていますが、Windows のコミットチャージはいずれも 2 GB を超えませんので、容量の差は結果には表れないと考えています。

また、今回ベンチマークに使用するアプリケーションは 32 bit アプリケーションと 64 bit アプリケーションがあります。64 bit アプリケーションはネイティブコードですが、32 bit アプリケーションは WOW64 というエミュレーションレイヤ上で動作します。可能ならば 64 bit アプリケーションで比較したいところではありますが、32 bit でしか提供されないアプリケーションがほとんどを占めますので、それらは WOW64 で実行します。

CPU をオーバークロックしたものも一緒に比較します。Core 2 Duo E6600 は 2.40 GHz と 3 GHz の両方を比較します。また、Core i7 920 は 2.66 GHz、3 GHz、4 GHz の 3 通りで比較します。つまり Pentium 4、Core 2 Duo、Core i7 のすべてを 3 GHz に統一してみました。その点について注目していただけると、興味深い結果が見られると思います。

Core i7 920 2.66 GHz に関しては、2.66 GHz 時の正確な性能を取得するのが目的ではなく、デフォルトの設定での性能を見るのが目的です。よって 2.66 GHz 時のみ、ターボモードを有効にしてあります。それ以上の周波数ではターボモードは無効にしてあります。

Core i7 はすべて Hyper Threading を有効にしています。

Super PI Mod (WOW64)

Super PI Mod で円周率 100 万桁を計算する時間を比較します。これは唯一、アプリケーションベンチマークではありませんが、いつもやっているので一応やります。これが速いからといって、特別何かが有利なわけではありません。

スコアは処理時間 (秒) で算出されます。今回は秒の逆数をとって 100 倍してあります。すなわち、1 秒間に何 % 完了したかを表します。

タイムは Pentium 4 が 44.093 秒、Core 2 Duo が 21.668 秒、17.260 秒、Core i7 が 14.882 秒、14.025 秒、10.592 秒です。

メモリコントローラ内蔵によってメモリレイテンシが低く抑えられたことによる効果と、大容量の L3 キャッシュの効果が出ているようです。同じ 3 GHz 同士の比較では、Core i7 が Core 2 Duo よりも 23 % も高速になっています。

Windows Media エンコーダ 9 でのビデオエンコード (x64)

Windows Media エンコーダ 9 の 64 bit 版を使用して、ビデオをエンコードする時間を比較します。

出力ファイルの作成日時と更新日時を比較し、その差分から、エンコードに何秒かかったかを調べます。エンコードするのは DVD をリッピングした 312 MB の MPEG2 ストリームです。ビデオは 720x480 画素、アスペクト比は 16:9、時間は 4 分 33 秒。これをインターレース保持、ピクセルアスペクトを入力と同じに設定し、クオリティベースのクオリティ 90 という設定で、Windows Media エンコーダにダイレクトに入力してエンコードします。それ以外の特別なフィルタは加えません。オーディオもクオリティベースのクオリティ 90 で 48 KHz のままエンコードします。使用するコーデックは「Windows Media Video 9 Advanced Profile」および「Windows Media Audio 9.2」です。

フレーム数 8,187 をかかった時間 (秒) で割り算します。すなわち、1 秒間に何フレームをエンコードしたかを示しています。

タイムは、Pentium 4 が 30 分 43 秒、Core 2 Duo が 13 分 34 秒、10 分 53 秒、Core i7 が 5 分 05 秒、4 分 43 秒、3 分 34 秒です。

CPU の性能差がもっとも表れやすい処理ですので、非常に大きな差になっています。Core i7 のスピードが際立っています。「Windows Media Video 9 Advanced Profile」は 4 スレッドを使用してエンコードします。まず、この時点でシングルコア、デュアルコア、クアッドコアの差がはっきりと出ます。

3 GHz で比較してみますと、Core i7 がクアッドであることを考慮しても、Core 2 に対して 10 % 以上性能が向上していることが確認できます。Core 2 をクアッドにしても 25.0 にしかなりませんからね。

Pentium 4 はもうおもちゃですね (笑)。しかし、Pentium 4 は Hyper Threading が有効でこの数値です。これをオフにすると 20 % 性能が低下します。

WinRAR でのファイル圧縮 (WOW64)

WinRAR を使用して、ファイルを RAR 形式に圧縮する時間を比較します。使用するのはバージョン 3.80。

WinRAR にはベンチマークモードがついていますがこれを使用せず、実際にファイルを圧縮するのにかかった時間を比較します。なぜベンチマークモードを使用しないかというと、ベンチマークモードではおそらくファイルへのアクセスをせずに純粋な圧縮性能を算出するため、実際の使用状況とは少し違った結果になると考えたからです。

出力ファイルの作成日時と更新日時を比較し、その差分から、圧縮に何秒かかったかを調べます。ハードディスクの性能差が出にくいように、同じハードディスクの同じパーティションにあるファイルを同じ場所へ圧縮するように指示しました。圧縮に使用したのは 631 フォルダ 8,022 ファイル、合計のサイズが 904 MB です。これを圧縮率標準で圧縮します。

合計サイズ 904 MB をかかった時間で割り算します。1 秒間に何キロバイトを圧縮したかを示しています。

こちらも Core i7 の性能が際立っています。WinRAR は 3 スレッド以上のマルチスレッドに対応しているようです。デュアルコアである Core 2 Duo との性能差がこれほどにまでなっていますからね。

PowerPoint 2007 での PDF 変換 (WOW64)

PowerPoint 2007 のスライドを PDF に変換するまでの時間を比較します。PDF への変換には Adobe Acrobat ではなく、マイクロソフトが提供する Office 2007 用の無料アドインを使用します。

Office 2007 は PDF を一時フォルダに作成し、完成してから指定フォルダへコピーをおこなうようなので、作成日時と更新日時の差分を調べる方法は使えません。ほかに方法がないので、ストップウォッチで測定します。誤差は 1 秒以内です。十分な精度が得られるように、スライドの枚数やオブジェクト数を多めにします。今回は 96 枚のスライドを使用します。

かかった時間 (秒) の逆数を算出し、100 を掛け算しました。すなわち、1 秒間に何 % 完了したかを表した数値です。

こちらはそれほど大きな差になってはいませんが、それでも Core i7 が比較的高速です。おそらくこの処理はほとんどシングルスレッドでおこなわれるものと考えられます。そのため、コア数による差が現れにくく、コアそのものの性能差だけが表れていると考えられます。

FINAL FANTASY XI Official Benchmark 3 (WOW64)

FINAL FANTASY XI Official Benchmark 3 を実行し、そのスコアを比較します。High (高負荷) と Low (低負荷) のモードがありますが、High のみを比較します。

Pentium 4 マシンはグラフィックスインターフェースが AGP なので、GeForce 9600 GT が付けられません。グラフィックスカードの世代が違いすぎて比較にならないので、ここでは Core 2 Duo と Core i7 のみの比較です。

GeForce 9600 GT を使用している割に、全体的に数値が低いと感じたかも知れません。実はこのアプリケーションは Windows XP よりも Windows Vista はかなり性能が低下します。

Core i7 920 のデフォルトの状態でも E6600 3 GHz より高いスコアを示しています。3 GHz 同士を比較すると、そこそこの差になっています。

まとめ

今回おこなったテストに関しては、Core i7 920 2.66 GHz が Core 2 Duo 3 GHz をすべて上回るという結果になりました。Core i7 のシングルスレッド性能は Core 2 よりも 10 % 以上高いという結果です。Core i7 920 2.66 GHz はターボモードを有効にしてあり、実はほとんどのシーンで 2.80 GHz で動作していました。しかし同じ周波数でならば Core i7 が高速です。

特にマルチスレッドアプリケーションでは真価を発揮します。しかしながら、5 スレッド以上をビジーに実行できるアプリケーションはほとんどなく、ビデオエンコード処理でさえ 4 スレッドしか使用しません。本当の Core i7 の性能を見るには 5 スレッド以上のアプリケーションで評価すべきかも知れません。

また、Core i7 の 3D ゲームの性能に関しては、決して高くはありません。FINAL FANTASY XI Official Benchmark 3 の結果はたまたま良好でしたが、4Gamer.net の結果を見ると、Core i7 のアドバンテージはほとんどありません。ゲーマー以外のヘビーユーザには非常にお勧めできますが、ゲーマーには Core 2 Duo や Core 2 Quad から乗り換える必要性はほとんどないと考えられます。

8. 消費電力

消費電力は今のプロセッサにおいてもっとも重要なファクタです。現在の CPU の周波数が上げられないのは、消費電力と発熱が高くなってしまうからです。消費電力を下げることが性能向上の余地を生み出します。すなわち、消費電力が下がるということと性能が向上するということは同義なのです。

ワットチェッカーを使用して消費電力を測定します。CPU だけが消費している電力を調べることはできません。システム全体の消費電力です。下はワットチェッカー。現在の消費電力を 1 ワット単位で表示することができます。

まずは、ベンチマークテストで使用した、Pentium 4 マシン、Core 2 Duo マシン、Core i7 マシンの比較です。周波数はそれぞれのデフォルトで、EIST (SpeedStep) は有効にしてあり、VCore は Auto に設定してあります。

アイドル時の値は何もしていないときの最小の値を調べたものです。逆にロード時の値は Tripcode Explorer というソフトで CPU だけに負荷をかけ、そのときの最大値を調べたものです。Pentium 4 と Core 2 Duo には 2 スレッドを実行させ、Core i7 には 8 スレッドを実行させました。

Pentium 4 に取り付けたグラフィックスカード GeForce4 MX 4000 は、Core 2 Duo と Core i7 に取り付けた GeForce 9600 GT に比べ、アイドル時の消費電力が 10-20 W も低いことに注意してください。よって Pentium 4 をほかと同じ構成にすると、その消費電力は 10-20 W 高くなると考えてください。

Pentium 4 に GeForce 9600 GT を付けると、アイドル時 140-150 W、ロード時 197-207 W くらいになると予想されます。アイドル時はもっとも高いですね。

Core 2 Duo は非常に優秀です。アイドル時、ロード時ともに最小値となっています。

Core i7 はロード時では 226 W と非常に高いです。しかしながらアイドル時では Core 2 Duo よりも 8 W 高いだけにとどまっています。Core i7 のアイドル時の値については、思ったよりも良好な結果です。というのは、Core 2 Duo と比較して Core i7 のダイサイズ (チップの面積) は非常に巨大です (Core 2 Duo が 143 平方ミリメートル、Core i7 が 246 平方ミリメートル)。ダイサイズが大きいとアイドル時の消費電力が高くなりますが、わずか 8 W 程度に抑えられています。

これを見て、「ああ、やっぱり Core i7 は爆熱なんだな」と思ったでしょうか?

個人的な考え方として、コア数の異なる CPU で最大消費電力を比較しても意味がないと思います。ピーク演算性能が圧倒的に高いのですから、消費電力も高くなって当然ですからね。

消費電力あたりの性能という観点で見れば、Core 2 Duo と Core i7 は同じ水準を維持していると思います。この最大消費電力が受け入れられないという方は、周波数のさらに低いモデルや、コア数の少ないモデルを選択すればよいだけのことです (今のところは存在しませんが)。また、Core i7 のコア数は 4 個ですが、BIOS で 1 個や 2 個に制限することもできます。こうしておけば実質 TDP が下がったことになります。

この先、ハイエンド CPU の TDP は常に 130 W になると考えられます。なぜなら、TDP を下げる余裕があるなら、その分、コアを増やしたり周波数を上げたりして性能向上させた方がいいからです。

9. 結論

Core i7 をいろいろ調べてみましたが、総合的にはどうでしょう。個人的な見解としては、まあまあ良好な結果だったと言えます。シングルスレッド性能は Core 2 よりも 10 % 以上向上していますし、マルチスレッド性能については Hyper Threading のおかげでかなり高い数値を示します (示すはずです)。

アイドル時の消費電力は Core 2 並みに低いです。また、クアッドコア CPU がフルロード状態になるシーンはほとんどありません。よって、CPU パワーが必要になる限られたシーンでだけ、必要な電力を消費してパフォーマンスを提供してくれると考えれば、最大消費電力が高いことについてはほとんど問題にならないでしょう。

ただ、現状では TDP 130 W モデルのみということもあり、「素人にはお勧めできない」です。扱いが難しいのは確かです。オーバークロックするかしないかにかかわらず、すべての CPU コアをロード状態にして温度を監視し、十分な排熱ができているか確認しましょう。

2009 年第 3 四半期、Lynnfield と呼ばれている Core i7 の下位モデルがリリースされます。Core i7 と比較すると、クアッドコアのままですが、メモリコントローラが 2-channel に削減されており、マザーボードの価格が安くなることが予想されています。一方でパフォーマンスの低下はほとんどないとみられています。さらに Lynnfield では PCI Express インターフェースが CPU に内蔵され、ノースブリッジが消えます。チップセットは 1 チップ構成になります。また、2010 年の初頭には CPU にグラフィックス機能を統合した Havendale がリリースされます。グラフィックスを内蔵する代わりにコア数が 2 個に削減されます。さらに 2010 年の初頭には 32 nm プロセスで製造される、Core i7 の 6 コア版 (通称 Westmere) がリリースされます。6 コア 12 スレッドを実行し、12 MB の L3 キャッシュを搭載します。今後ますますコア数が増えていきますね。

戻る