mirror of https://github.com/KusakabeShi/EtherGuard-VPN.git synced 2024-12-14 10:01:01 +01:00

Kusakabe Si cdb096b8e4 DampingResistance to DampingFilterRadius

2021-12-26 16:33:18 +00:00

Etherguard

Super Mode

此模式是受到n2n的啟發，分為SuperNode和EdgeNode兩種節點
EdgeNode首先和SuperNode建立連線，藉由SuperNode交換其他EdgeNode的資訊
由SuperNode執行Floyd-Warshall演算法，並把計算結果分發給EdgeNode

Quick start

首先按需求修改gensuper.yaml

Config output dir: /tmp/eg_gen
ConfigTemplate for super node: ""
ConfigTemplate for edge node: ""
Network name: eg_net
Super Node:
  Listen port: 3456
  EdgeAPI prefix: /eg_net/eg_api
  Endpoint(IPv4)(optional): example.com
  Endpoint(IPv6)(optional): example.com
  Endpoint(EdgeAPI): http://example.com:3456/eg_net/eg_api
Edge Node:
  Node IDs: "[1~10,11,19,23,29,31,55~66,88~99]"
  MacAddress prefix: ""                 # 留空隨機產生
  IPv4 range: 192.168.76.0/24           # IP的部分可以直接省略沒關係
  IPv6 range: fd95:71cb:a3df:e586::/64  # 這個欄位唯一的目的只是在啟動以後，調用ip命令，幫tap接口加個ip  
  IPv6 LL range: fe80::a3df:0/112       # 和VPN本身運作完全無關

接著執行這個，就會生成所需設定檔了。

$ ./etherguard-go -mode gencfg -cfgmode super -config example_config/super_mode/gensuper.yaml

把一個super，2個edge分別搬去三台機器
或是2台機器，super和edge可以是同一台

在Supernode執行

./etherguard-go -config [設定檔位置] -mode super

在EdgeNode執行

./etherguard-go -config [設定檔位置] -mode edge

Documentation

在了解Super Mode的運作之前，建議您先閱讀Static Mode的運作方法，再閱讀本篇會比較好

在EdgeNode的SuperMode下，設定檔裡面的NextHopTable以及Peers是無效的。
這些資訊都是從SuperNode上面下載
同時，SuperNode會幫每個連線生成pre-shared key，分發給edge使用(如果啟用UsePSKForInterEdge的話)。

SuperMsg

但是比起StaticMode，SuperMode引入了一種新的 終點ID 叫做 NodeID_SuperNode。
所有送往SuperNode的封包都會是這種類型。
這種封包不會在EdgeNode之間傳播，收到也會不會轉給任何人，如同終點ID == 自己一般

Control Message

從SuperMode開始，我們有了StaticMode不存在的Control Message。他會控制EtherGuard一些行為
在SuperMode下，我們不會轉發任何控制消息。我們只會直接接收或發送給目標。
下面列出Super Mode會出現的Control message

Register

具體運作方式類似這張圖

EdgeNode發送Register給SuperNode
SuperNode收到以後就知道這個EdgeNode的Endpoint IP和Port number。
更新進資料庫以後發布UpdatePeerMsg。
其他edge node收到以後就用HTTP EdgeAPI去下載完整的peer list。並且把自己沒有的peer通通加到本地

Ping/Pong

有了peer list以後，接下來的運作方式類似這張圖

Edge node 會嘗試向其他所有peer發送Ping，裡面會攜帶節點自己的時間
Ping 封包的TTL=0 所以不會被轉發，只會抵達可以直連的節點
收到Ping，就會產生一個Pong，並攜帶時間差。這個時間就是單向延遲
但是他不會把Pong送回給原節點，而是送給Super node

AdditionalCost

有了各個節點的延遲以後，還不會立刻計算Floyd-Warshall，而是要先加上AdditionalCost

以這張圖片的情境為例:

Path	Latency	Cost	Win
A->B->C	3ms	3	O
A->C	4ms	4

但是這個情境，3ms 4ms 只相差1ms
為了這1ms而多繞一趟實在浪費，而且轉發本身也要時間

每個節點有了AdditionalCost參數，就能設定經過這個節點轉發，所需額外增加的成本

假如ABC全部設定了AdditionalCost=10

Path	Latency	AdditionalCost	Cost	Win
A->B->C	3ms	20	23
A->C	4ms	10	14	O

A->C 就換選擇直連，不會為了省下1ms而繞路
這邊AdditionalCost=10可以解釋為: 必須能省下10ms，才會繞這條路

這個參數也有別的用途
針對流量比較貴的節點，可以設定AdditionalCost=10000
別人就不會走他中轉了，而是盡量繞別的路，或是直連
除非別條路線全掛，只剩這挑Cost 10000的路線

還有一個用法，全部節點都設定AdditionalCost=10000
無視延遲，全節點都盡量直連，打動失敗才繞路

UpdateNhTable

Super node收到節點們傳來的Pong以後，就知道他們的單向延遲了。接下來的運作方式類似這張圖

Super node收到Pong以後，就會更新它裡面的Distance matrix，並且重新計算轉發表
如果有變動，就發布UpdateNhTableMsg
其他edge node收到以後就用HTTP EdgeAPI去下載完整的轉發表

ServerUpdate

通知EdgeNode有事情發生

關閉EdgeNode程式
- 版本號不匹配
- 該edge的NodeID配置錯誤
- 該Edge被刪除
通知EdgeNode有更新
- UpdateNhTable
- UpdatePeer
- UpdateSuperParams

HTTP EdgeAPI

為什麼要用HTTP額外下載呢?直接UpdateXXX夾帶資訊不好嗎?
因為udp是不可靠協議，能攜帶的內容量也有上限。
但是peer list包含了全部的peer資訊，長度不是固定的，可能超過
所以這樣設計，UpdateXXX單純只是告訴edge node有資訊更新，請速速用HTTP下載

而且UpdateXXX本身不可靠，說不定根本就沒抵達edge node。
所以UpdateXXX這類資訊都帶了state hash。用HTTP API的時候要帶上
這樣super node收到HTTP API看到state hash就知道這個edge node確實有收到UpdateXXX了。
不然每隔一段時間就會重新發送UpdateXXX給該節點

預設配置是走HTTP。但為了你的安全著想，建議使用nginx反代理成https
有想過SuperNode開發成直接支援https，但是證書動態更新太麻煩就沒有做了

HTTP Manage API

HTTP還有5個Manage API，給前端使用，幫助管理整個網路

super/state

curl "http://127.0.0.1:3456/eg_net/eg_api/manage/super/state?Password=passwd_showstate"

可以給前端看的，用來顯示現在各節點之間的單向延遲狀況
之後可以用來畫力導向圖。

這個json下載下來有一個叫做infinity的欄位，值應該永遠是9999
因為json沒辦法表達無限大。所以大於這個數值的就是無限大，不可達的意思
這個數值是編譯時決定的，一般不會動。但保留變更的彈性
所以有這個欄位，前端顯示時看到數值大於這個，就視為不可達，不用畫線了

返回值範例:

{
  "PeerInfo": {
    "1": {
      "Name": "Node_01",
      "LastSeen": "2021-12-05 21:21:56.039750832 +0000 UTC m=+23.401193649"
    },
    "2": {
      "Name": "Node_02",
      "LastSeen": "2021-12-05 21:21:57.711616169 +0000 UTC m=+25.073058986"
    }
  },
  "Infinity": 99999,
  "Edges": {
    "1": {
      "2": 0.002179297
    },
    "2": {
      "1": -0.00030252
    }
  },
  "Edges_Nh": {
    "1": {
      "2": 0.012179297
    },
    "2": {
      "1": 0.00969748
    }
  },
  "NhTable": {
    "1": {
      "2": 2
    },
    "2": {
      "1": 1
    }
  },
  "Dist": {
    "1": {
      "1": 0,
      "2": 0.012179297
    },
    "2": {
      "1": 0.00969748,
      "2": 0
    }
  }
}

欄位意義:

PeerInfo: 節點id，名稱，上次上線時間
Edges: 節點直連的延遲，99999或是缺失代表不可達(打洞失敗)
Edges_Nh: 加上AdditionalCost之後的結果，也就是餵給 FloydWarshall(g) 的真正參數
NhTable: 計算結果
Dist: 節點走Etherguard之後的延遲

peer/add

再來是新增peer，可以不用重啟Supernode就新增Peer

範例:

curl -X POST "http://127.0.0.1:3456/eg_net/eg_api/manage/peer/add?Password=passwd_addpeer" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -d "NodeID=100&Name=Node_100&PubKey=DG%2FLq1bFpE%2F6109emAoO3iaC%2BshgWtdRaGBhW3soiSI%3D&AdditionalCost=1000&PSKey=w5t64vFEoyNk%2FiKJP3oeSi9eiGEiPteZmf2o0oI2q2U%3D&SkipLocalIP=false"

參數:

URL query: Password: 新增peer用的密碼，在設定檔配置
Post body:
1. NodeID: Node ID
2. Name: 節點名稱
3. PubKey: Public Key
4. PSKey: Pre shared Key
5. AdditionalCost: 此節點進行封包轉發的額外成本。單位: 毫秒
6. SkipLocalIP: 是否使該節點不使用Local IP
7. nexthoptable: 如果你的super node的graphrecalculatesetting是static mode，那麼你需要在這提供一張新的NextHopTable，json格式

返回值:

http code != 200: 出錯原因
http code == 200，一份edge的參考設定檔
- 會根據 edgetemplate 裡面的內容，再填入使用者的資訊(nodeid/name/pubkey)
- 方便使用者複製貼上

peer/del

有兩種刪除模式，分別是使用Password刪除，以及使用privkey刪除。
設計上分別是給管理員使用，或是給加入網路的人，想離開網路使用

使用Password刪除可以刪除任意節點，以上面新增的節點為例，使用這個API即可刪除剛剛新增的節點

curl "http://127.0.0.1:3456/eg_net/eg_api/manage/peer/del?Password=passwd_delpeer&NodeID=100"

也可以使用privkey刪除，同上，但是只要附上privkey參數就好

curl "http://127.0.0.1:3456/eg_net/eg_api/manage/peer/del?PrivKey=iquaLyD%2BYLzW3zvI0JGSed9GfDqHYMh%2FvUaU0PYVAbQ%3D"

參數:

URL query:
1. Password: 刪除peer用的密碼，在設定檔配置
2. nodeid: 你想刪除的Node ID
3. privkey: 該節點的私鑰

返回值:

http code != 200: 錯誤訊息
http code == 200: 被刪除的nodeID

peer/update

更新節點的一些參數

curl -X POST "http://127.0.0.1:3456/eg_net/eg_api/manage/peer/update?Password=passwd_updatepeer&NodeID=1" \
  -H "Content-Type: application/x-www-form-urlencoded" \
  -d "AdditionalCost=10&SkipLocalIP=false"

super/update

更新SuperNode的一些參數

curl -X POST "http://127.0.0.1:3456/eg_net/eg_api/manage/super/update?Password=passwd_updatesuper" \
  -H "Content-Type: application/x-www-form-urlencoded" \
  -d "SendPingInterval=15&HttpPostInterval=60&PeerAliveTimeout=70&DampingFilterRadius=3"

SuperNode Config Parameter

Key	Description
NodeName	節點名稱
PostScript	初始化完畢之後要跑的腳本
PrivKeyV4	IPv4通訊使用的私鑰
PrivKeyV6	IPv6通訊使用的私鑰
ListenPort	udp監聽埠
ListenPort_EdgeAPI	HTTP EdgeAPI 的監聽埠
ListenPort_ManageAPI	HTTP ManageAPI 的監聽埠
API_Prefix	HTTP API prefix
RePushConfigInterval	重新push`UpdateXXX`的間格
HttpPostInterval	EdgeNode 使用EdgeAPI回報狀態的頻率
PeerAliveTimeout	判定斷線Timeout
SendPingInterval	EdgeNode 之間使用Ping/Pong測量延遲的間格
LogLevel	紀錄log
Passwords	HTTP ManageAPI 的密碼，5個API密碼是獨立的
GraphRecalculateSetting	一些和Floyd-Warshall演算法相關的參數
NextHopTable	StaticMode 模式下使用的轉發表
EdgeTemplate	HTTP ManageAPI `peer/add` 返回的edge的參考設定檔
UsePSKForInterEdge	幫Edge生成PreSharedKey，供edge之間直接連線使用
Peers	EdgeNode資訊

Passwords	Description
ShowState	HTTP ManageAPI `super/state` 的密碼
AddPeer	HTTP ManageAPI `peer/add` 的密碼
DelPeer	HTTP ManageAPI `peer/del` 的密碼
UpdatePeer	HTTP ManageAPI `peer/update` 的密碼
UpdateSuper	HTTP ManageAPI `super/update` 的密碼

GraphRecalculateSetting	Description
StaticMode	關閉`Floyd-Warshall`演算法，只使用設定檔提供的NextHopTable`。SuperNode單純用來輔助打洞
ManualLatency	手動設定延遲，不採用EdgeNode回報的延遲(單位: 毫秒)
JitterTolerance	抖動容許誤差，收到Pong以後，一個37ms，一個39ms，不會觸發重新計算比較對象是上次更新使用的值。如果37 37 41 43 .. 100 ，每次變動一點點，總變動量超過域值還是會更新
JitterToleranceMultiplier	抖動容許誤差的放大係數，高ping的話允許更多誤差 https://www.desmos.com/calculator/raoti16r5n
DampingFilterRadius	防抖用低通濾波器的window半徑
TimeoutCheckInterval	週期性檢查節點的連線狀況，是否斷線需要重新規劃線路
RecalculateCoolDown	Floyd-Warshal是O(n^3)時間複雜度，不能太常算。設個冷卻時間有節點加入/斷線觸發的重新計算，無視這個CoolDown

Peers	Description
NodeID	節點ID
PubKey	公鑰
PSKey	預共享金鑰
AdditionalCost	繞路成本(單位: 毫秒) 設定-1代表使用EdgeNode自身設定
SkipLocalIP	打洞時，不使用EdgeNode回報的本地IP，僅使用SuperNode蒐集到的外部IP
EndPoint	SuperNode啟動時，主動向Edge連線的Endpoint
ExternalIP	針對沒開Nat Reflection，又要把SuperNode和EdgeNode跑在同一内網的情境使用沒有Nat Reflection，SuperNode無法讀取內網EdgeNode的外部IP，只能手動指定了

EdgeNode Config Parameter

EdgeConfig Root

DynamicRoute	Description
SendPingInterval	發送Ping訊息的間隔(秒)
PeerAliveTimeout	被標記為離線所需的無反應時間(秒)
TimeoutCheckInterval	檢查間格(秒)，檢查是否有任何peer超時，若有就標記
ConnNextTry	被標記以後，嘗試下一個endpoint的間隔(秒)
DupCheckTimeout	重複封包檢查的timeout(秒) 完全相同的封包收第二次會被丟棄
AdditionalCost	繞路成本(毫秒)。僅限SuperNode設定-1時生效
SaveNewPeers	是否把下載來的鄰居資訊存到本地設定檔裡面
SuperNode	SuperNode相關設定
P2P	P2P相關設定，SuperMode用不到
NTPConfig	NTP時間同步相關設定

SuperNode	Description
UseSuperNode	是否啟用SuperNode
PSKey	和SuperNode通訊用的PreShared Key
EndpointV4	SuperNode的IPv4 Endpoint
PubKeyV4	SuperNode的IPv4公鑰
EndpointV6	SuperNode的IPv6 Endpoint
PubKeyV6	SuperNode的IPv6公鑰
EndpointEdgeAPIUrl	SuperNode的EdgeAPI存取路徑
SkipLocalIP	不回報本地IP，避免和其他Edge內網直連
SuperNodeInfoTimeout	實驗性選項，SuperNode離線超時，切換成P2P模式需先打開P2P模式 `UseP2P=false`本選項無效 P2P模式尚未測試，穩定性未知，不推薦使用

NTPConfig	Description
UseNTP	是否使用NTP同步時間
MaxServerUse	向多少NTP伺服器發送請求
SyncTimeInterval	多久同步一次時間
NTPTimeout	NTP伺服器連線Timeout
Servers	NTP伺服器列表

V4 V6 兩個公鑰

為什麼要分開IPv4和IPv6呢?
因為有這種情況:

這樣的話SuperNode就不知道Node02的ipv4地址，就不能幫助Node1和Node2打洞了

所以要像這樣，V4和V6都建立一條通道，才能讓V4和V6同時都被處理到

打洞可行性

對於不同的NAT type，打洞的可行性可以參考這張圖(出處)

還有，就算雙方都是ConeNAT，也不保證100%成功。
還得看NAT設備的支援情況，詳見此文，裡面3.5章節描述的情況，也無法打洞成功

Relay node

因為Etherguard的Supernode單純只負責幫忙打洞+計算Floyd-Warshall，並分發運算結果
而他本身並不參與資料轉發。因此如上章節描述打洞失敗，且沒有任何可達路徑的話，就需要搭建relay node
基本上任意一個節點有公網ip，就不用擔心沒有路徑可達了。但是還是說明一下

Relay node其實也是一個edge node，只不過被設定成為interface=dummy，不串接任何真實接口

只是在設定時要注意，Supernode地只要設定成Supernode的外網ip。
因為如果用127.0.0.1連接supernode，supernode看到封包的src IP就是127.0.0.1，就會把127.0.0.1分發給Node_1和Node_2
Node_1和Node_2看到Node_R的連線地址是127.0.0.1，就連不上了

Run example config

在不同terminal分別執行以下命令

./etherguard-go -config example_config/super_mode/Node_super.yaml -mode super
./etherguard-go -config example_config/super_mode/Node_edge001.yaml -mode edge
./etherguard-go -config example_config/super_mode/Node_edge002.yaml -mode edge

因為是stdio模式，stdin會讀入VPN網路
請在其中一個edge視窗中鍵入

b1aaaaaaaaaa

b1會被轉換成 12byte 的layer 2 header，b是廣播地址FF:FF:FF:FF:FF:FF，1是普通地址AA:BB:CC:DD:EE:01，aaaaaaaaaa是後面的payload，然後再丟入VPN
此時應該要能夠在另一個視窗上看見字串b1aaaaaaaaaa。前12byte被轉換回來了

看完本章捷，接下來你就能了解一下P2P Mode的運作

19 KiB Raw Blame History Unescape Escape