首先先感谢老哥的文章:h构建多云环境下的K3S集群,但是我尝试在centos 8.2上面前面一直执行报错
并且安装glibc 2.17时还会报错make版本太低,所以直接放弃centos,投入ubuntu的怀抱
现在腾讯云的活动确实不错,【腾讯云】云产品限时秒杀,爆款2核4G云服务器首年74元,点进去之后三年8M 2c4g轻量应用服务器222元,月流量1200G,好了,说说k3s吧,K3s相对比K8s更加轻量,对于服务器的要求较低:
- 系统内核版本:Linux 3.10+ (CentOS 7, Debian 8/9, Ubuntu 14.04+)
- K3S Server端最低内存要求:512 MB
- K3S Agent端内存最低要求:75MB
- 磁盘空间最低要求:200 MB
- 支持的硬件架构:x86_64, ARMv7, ARM64
实际使用过程中,可以在各种环境中进行使用(k3s在小到树莓派或大到 AWS a1.4xlarge 32GiB服务器的环境中),也就是使用场景可以小到一个家庭内部的小盒子(斐讯N1)
由于我之前买了一个三年的阿里云服务器(1M 1c2g),准备拿阿里云服务器做server,腾讯云服务器做agent做一个单master,单node的k3s集群,不同云服务器见通过内网是访问不了的(可以拓展一下场景,比如家内的linux服务器和外网的云服务器之间也是内网不通的),就需要wireguard来帮助我们做好vpn的功能,服务器的内核建议升级到5.6以上(centos和ubuntu下uname -r
查看),如果内核版本不够高,需要先升级内核,我这里说一下ubuntu的升级方法
以下内容需要在两台服务器上都进行执行
* server 阿里云 1M 1c2g ubuntu 20.04
* agent 腾讯云 8M 2c4g ubuntu 20.04
1.升级内核
在kernel.ubuntu.com中寻找自己要下载的内核版本,然后点进去,例如我选择的5.17.7
然后服务器上执行dpkg --print-architecture
查看一下自己的服务器是amd还是arm等,在上面打开的链接中选择好指定的架构,下载带有下面image和modules、generic的deb文件
- linux-image-X.Y.Z-generic-*.deb
- linux-modules-X.Y.Z-generic-.deb
然后上传到服务器上,当然我们也可以这样
下载速度有点慢,你可以直接进入我的阿里云盘下载,链接我设置的永久有效mkdir kernel cd kernel wget https://kernel.ubuntu.com/~kernel-ppa/mainline/v5.15.7/amd64/linux-image-unsigned-5.15.7-051507-generic_5.15.7-051507.202112080459_amd64.deb wget https://kernel.ubuntu.com/~kernel-ppa/mainline/v5.15.7/amd64/linux-modules-5.15.7-051507-generic_5.15.7-051507.202112080459_amd64.deb
下载完成之后,执行命令:
服务器重启之后再用sudo dpkg --install *.deb sudo reboot
uname -r
查看一下,现在内核版本已经更新到了5.15.7了,服务器内核已经执行成功之后,我们可以安装wireguard了2.安装wireguard
在我们的server服务器执行sudo apt update sudo apt upgrade -y sudo apt install -y iptables wireguard
hostnamectl set-hostname k3s-master
在我们的agent服务器执行hostnamectl set-hostname k3s-node1
3.安装k3s及配置
接下来,两台服务器都安装k3s
curl -sfL http://rancher-mirror.cnrancher.com/k3s/k3s-install.sh | INSTALL_K3S_MIRROR=cn sh -
稍等一会儿,查看我们的ip addr
///10.43.0.1我们当作server服务器的内网IP
kube-ipvs0: <BROADCAST,NOARP> mtu 1500 qdisc noop state DOWN group default
inet 10.43.0.1/32 scope global kube-ipvs0
valid_lft forever preferred_lft forever
下面的内容需要分别执行
server服务器
nano /etc/systemd/system/k3s.service
//k3s.service只需要修改ExecStart部分,内网IP10.43.0.1
[Unit]
Description=Lightweight Kubernetes
Documentation=https://k3s.io
Wants=network-online.target
After=network-online.target
[Install]
WantedBy=multi-user.target
[Service]
Type=notify
EnvironmentFile=/etc/systemd/system/k3s.service.env
KillMode=process
Delegate=yes
LimitNOFILE=1048576
LimitNPROC=infinity
LimitCORE=infinity
TasksMax=infinity
TimeoutStartSec=0
Restart=always
RestartSec=5s
ExecStartPre=-/sbin/modprobe br_netfilter
ExecStartPre=-/sbin/modprobe overlay
ExecStart=/usr/local/bin/k3s \
server --flannel-backend wireguard --tls-san 公网地址,内网地址 --node-ip 内网地址 --node-external-ip 公网地址 --no-deploy servicelb \
--disable traefik
--kube-proxy-arg "proxy-mode=ipvs" "masquerade-all=true" \
--kube-proxy-arg "metrics-bind-address=0.0.0.0"
nano /etc/systemd/system/k3s.service.env //然后直接Ctrl+X 按y退出来
获取token
cat /var/lib/rancher/k3s/server/node-token
# 内容类似如下:
K10fc6653356f8b0c457cd1a8e41d87b7d33b49a97f4e6b8qweqweqwewq12788a06e85647454::server:53c2qweqwe2222w4d8145be9e7
agent服务器
nano /etc/systemd/system/k3s.service
//k3s.service只需要修改ExecStart部分
///内网IP我们写成10.43.0.2
[Unit]
Description=Lightweight Kubernetes
Documentation=https://k3s.io
Wants=network-online.target
After=network-online.target
[Install]
WantedBy=multi-user.target
[Service]
Type=notify
EnvironmentFile=/etc/systemd/system/k3s.service.env
KillMode=process
Delegate=yes
LimitNOFILE=1048576
LimitNPROC=infinity
LimitCORE=infinity
TasksMax=infinity
TimeoutStartSec=0
Restart=always
RestartSec=5s
ExecStartPre=-/sbin/modprobe br_netfilter
ExecStartPre=-/sbin/modprobe overlay
ExecStart=/usr/local/bin/k3s agent\
--node-external-ip 公网IP \
--node-ip 内网IP\
--kube-proxy-arg "proxy-mode=ipvs" "masquerade-all=true" \
--kube-proxy-arg "metrics-bind-address=0.0.0.0"
设置当前服务器的设备变量
nano /etc/systemd/system/k3s.service.env
# 此处定义集群的api service访问地址以及token内容为:
K3S_URL=https://server的公网地址:6443
K10fc6653356f8b0c457cd1a8e41d87b7d33b49a97f4e6b8qweqweqwewq12788a06e85647454::server:53c2qweqwe2222w4d8145be9e7
然后server服务器和agent服务器都执行
systemctl daemon-reload
systemctl restart k3s
如果长时间Hold不执行下去,Ctrl+C取消,执行systemctl status k3s -r或者ajournalctl -u k3s.service -r
查看输出日志
如果报错信息是Failed to connect to proxy" error="x509: certificate is valid for 10.43.0.1, 127.0.0.1, 172.28.115.105, not xxx.xxx.xxx.xxx(server的公网IP)
先将两个服务器的K3s都停掉,然后全部执行
systemctl stop k3s
cd /var/lib/
rm -rf rancher
reboot
一般重启之后就好了
下面是服务器的端口开发截图