ネットワーク科学を読んで
サムネはお絵描きばりぐっとくん
スラムの課題図書
用語
スラムの友だちネットワークで例える
ノード
スラム民のこと
ノードの総数はNで表される
リンク
友だち関係のこと
例えば、「ノードAとノードBが友だちなら、AB間にリンクがある」という
次数
各ノードのリンク(友だち)の数
記号はk
平均次数
平均的な友だちの数
記号は<k>
ハブ
次数がとても高いノード、つまり友だちがめっちゃ多い人のこと
ネットワークと連結成分の違い
ネットワークはノードとリンクの全体のこと
連結成分はリンクでつながっている塊のこと
ネットワークは全スラム民およびそのつながりであり、連結成分は友だち関係でつながっている塊(以降は「群れ」と呼ぶことにする)と考えることができる。
つまり、「スラム内で友だち関係がない人は、スラム民だが、群れの一員ではない」ということになる。
ざっくり全体の説明
この本は、(カレーをスパイスから作るように)現実のネットワークを0から作ろうとしている。まず、モデル(ネットワークの設計図)を作り、シミュレーション(コンピュータを使って設計図どおりにネットワークを作成)し、手作りネットワークと現実のネットワークの特徴(友達の人数の分布など)を比較することで、モデルのできを評価する。んで、欠点があったら、それを補う仕組みをモデルに組み込んで、シミュレーションして、現実のネットワークと比較して...の繰り返し。
第3章
ランダムネットワーク・・・まずノード(人)があって、ランダムにリンクを張る(人と人がお友だちになる)。
欠点 現実のネットワークにはハブ(友達がめっちゃいる人)がいるけど、ランダムネットワークにはハブが存在しない。
第4章
ハブのないランダムネットワークから、ハブのあるスケールフリーネットワークに変更して、モデルを改善しよう!
第5章
現実のネットワークにあって、ランダムネットワークにないもの。それは、「成長」と「優先的選択」だ。
成長・・・ネットワークには新たに人が増えていく。
優先的選択・・・新しいノードは、次数が高いノード(友だちが多い人)と結びつこうとする。
バラバシ・アルバート・モデル・・・「成長」と「優先的選択」を組み込んだモデル
なんと「成長」と「優先的選択」をモデルに組み込むと、スケールフリー(次数がべき分布)になることが判明❗️
どちらか片方がモデルに入っていないと、スケールフリーネットワークにならないこともシミュレーションで検証済み。
欠点 バラバシ・アルバート・モデルだと、次数最大のノードを追い越して、新たなノードが最大次数になることはない。しかし現実は諸行無常。時代によってトップは変わる。
第6章
ビアンコーニ・バラバシ・モデル・・・各ノードに適応度(他との結びつきやすさ)を組み込んだモデル
適応度を導入することで、新人が次数で古参を追いこすことが可能に。「生まれつきの人気者」の概念を取り入れる。
バラバシ・アルバート・モデル(BAモデル)の欠点
1. BAモデルの次数分布は傾きが固定であるが、実際のネットワークでは傾きに幅がある。
2. BAモデルの次数分布はべき分布(以下の図の赤線のように直線)であるが、実際のネットワークは、「低次数の飽和(赤線より低くなる)」と「高次数のカットオフ(次数の高さに制限がある)」がある。
3. 現実のネットワークでは、リンクが付け加えられたり、ノードが除去されたりするが、BAモデルではそのような基本的な過程が無視されている。
画像非公開
『ネットワーク科学』第4章 図4.23 次数分布のスケーリング
初期誘引度・・・BAモデルの優先的選択に定数を加えて、次数0のノードにもリンクが張られるようにする。
BAモデルの優先的選択の場合、次数0のノードにリンクが張られる確率はゼロである。
→ 低次数にリンクが張られる確率が高まるため、ノードの次数が押し上げられ、低次数の飽和が起こる。
内部リンク・・・新規ノードだけではなく、元々存在するノード間にもリンクを張る。
ノード除去・・・その名のとおり。
加速成長・・・リンクを追加するスピードが、ノードを追加するスピードよりも速くなる。
加齢・・・新しいリンクを獲得する比率が次第に減っていく。
画像非公開
『ネットワーク科学』第6章 図6.15 ネットワークのトポロジーに影響を与える基本過程
以上のようなさまざまな素過程がネットワークの特徴に影響を与える。γは次数分布の傾き。素過程を加えることによって、傾きは変化する。
第7章
同じ次数分布でも異なる次数相関をもつネットワーク
次数親和的なネットワーク・・・ハブはハブ同士、低次数のノードは低次数のノード同士でつながりやすい。
次数排他的なネットワーク・・・ハブは低次数のノードとつながりやすい。
ニュートラルなネットワーク・・・ランダムにつながる。
優先的選択ではリンク数の期待値がノードの次数に比例するため、ハブ間のリンク数の期待値が1以上になる場合がある。しかしBAモデルでは、ノード間にはリンクが1つしかつかない。この矛盾が高次数のカットオフを引き起こす(次数分布の傾きがBAモデルよりも緩やかである場合にのみ起こる)。
第8章
ネットワークの頑健性
頑健性とは、ある一つのノードを選択して、そのノードとそのノードから出ているリンクをネットワークから取り除いたときの、ネットワークのバラバラになりにくさのことを意味してる。ランダムな故障やハブを狙った攻撃(最大次数のノードから順に破壊)に対して、どれくらい強いかという実用的な話。例えば、スケールフリーネットワークだと、ランダムな故障に対しては強く、ハブを狙った攻撃には弱い。
スケールフリーにはせずにノードの繋げ方を工夫してやると、ランダムな故障にも、ハブを狙った攻撃にも強いネットワークを作ることができる。
ランダムな故障とハブを狙った攻撃の両方への頑健性を最大化するネットワークの次数分布は二峰性分布(山が2つある分布)である。もっというと、最大次数のノードが1つだけ、その他のノードは全て最小次数である。
画像非公開
『ネットワーク科学』第8章 図8.24 攻撃と故障への耐久性の最適化
横軸はリンクの除去率。縦軸はノードをランダムに選択したときに最大連結成分内のノードである確率。
二峰性分布の場合、平均次数2のときは攻撃に対して弱いけど、3以上だとどちらに対しても強いね
第3章 ランダム・ネットワーク
手始めに単純なモデルを考える。
ランダムネットワークとは
スラム民N人に対して、確率的にリンクを張る(友だちになる)ネットワーク
ランダムネットワークの特徴
よこ軸は平均次数<k>、つまり平均的な友だちの数
たて軸は最大の群れの割合
(最大の群れの人数)÷(スラム民の総数)
リンクがないはじめは0
1つの群れに全員がつながると1になる
画像非公開
『ネットワーク科学』第3章 図3.7 ランダム・ネットワークの成長
<k>が0以上1未満: 赤領域。とても小さな群れが少しだけある
<k>が1: 巨大な群れができる境目
<k>が1以上4.5未満: 黄領域。1つの巨大な群れができ、小さな群れが巨大な群れに繋がっていく
<k>が4.5以上: 青領域。1つの巨大な群れができ、小さな群れが巨大な群れに繋がっていく
スラム内の友だちの数の平均が1人を超えると、急激に巨大な群れが形成される(赤領域と黄領域では増加の仕方が全く変わることがポイント)
黄領域と青領域の境目はスラム民の総数Nによって違う
<k> = ln(N)
ランダムネットワークを作ってみた
N = 500
外側にドーナツ状にいるのが、ぼっち。
真ん中のひとびとがムレムレしてます。
ランダムネットワークによって正確に記述されるような現実のネットワークは知られていない
第4章 スケールフリーの性質
多くのネットワークにはスケールフリー性(友だちの数の分布がべき分布になる)が見られることがわかった。
ランダムネットワークではハブは説明できない
著者の昔話
スケールフリー性をもつネットワーク
スケールフリーでないネットワーク
第5章 バラバシ・アルバート・モデル
成長と優先的選択
ランダムネットワークが現実のネットワークと異なるのはなぜか?
それは以下の現実のネットワークの2つの特徴を満たしていないからである。
成長
時間が経つごとにノード(人の数)が増えていく。優先的選択
新しいノードは多くのリンクをもつノード(友だちの多い人)に繋がろうとする。
成長と優先的選択を組み込んだモデル(バラバシ・アルバート・モデル)がスケールフリー性を生み出すことが発見された
成長と優先的選択のどちらか片方が欠けているとスケールフリー性は生まれない
第8章 ネットワークの頑健性
電力網の頑健性
平均次数(ノードが持つ平均のリンク数)が低い電力網の方が、安定した電力供給を行なっている
頑健性とは、ある一つのノードを選択して、そのノードとそのノードから出ているリンクをネットワークから取り除いたときの、ネットワークのバラバラになりにくさのことを意味してる。ランダムな故障やハブを狙った攻撃(最大次数のノードから順に破壊)に対して、どれくらい強いかという実用的な話。例えば、スケールフリーネットワークだと、ランダムな故障に対しては強く、ハブを狙った攻撃には弱い。
スケールフリーにはせずにノードの繋げ方を工夫してやると、ランダムな故障にも、ハブを狙った攻撃にも強いネットワークを作ることができる。
画像非公開
『ネットワーク科学』第8章 図8.26 電力網
ヨーロッパの電力網ネットワークの頑健性
画像 図8.26(f)
横軸: 平均次数
縦軸: ネットワークの寸断に必要なノードの割合(以降、fと表記する)
※fはハブを狙った攻撃が起きたと想定したときの推定値
点は、実際の33ヶ所の電力網
曲線は、次数分布が実際の電力網ネットワークと同じな一般的なネットワーク(その他の実際のネットワークの特徴は同じにしていない。)
グループ1は、実際のネットワーク(点)と一般的なネットワーク(曲線)のfは大体同じ。
グループ2は、実際のネットワークの方が一般的なネットワークより、ネットワークの寸断に必要なノードの割合(f)が大きい。つまり頑健性が高くなっている。
停電についての情報を比較してみると、グループ1は、頑健性が高くなっっているグループ2に比べて、電力損失が2倍以上、電力未供給が4倍以上、平均中断時間が5倍以上になっている。
つまり、平均次数の低い(けど、頑健性が一般のネットワークより高い)電力網の方が、安定した電力供給を行なっている。
文献
この記事が気に入ったらサポートをしてみませんか?