从零开始的K8s生产实践 #1 基础环境安装-Ceph和CephFS

博主： 0xC4A1
发布时间：2023 年 01 月 07 日
2 次浏览
暂无评论
5165字数
分类： Docker Linux Ceph 容器化服务器运维

前言

前面我们提到过采用Ceph作为持久化存储实现，本篇将讲述Ceph的部署~~和Ceph-CSI在Kubernetes集群以DaemonSet形式的部署~~太长了留到下一篇再讲。
本篇中提到的任何IP均可在前述的部署环境机器表中找到对应机器。

实操

噩耗

如果您跟笔者一样不幸地选择了Ubuntu 22.04作为承载业务的发行版，那么您可能无法通过同在Ubuntu 20.04上相似的手段对Ceph进行部署。

由于社区已经停止维护ceph-deploy，我们已经没有办法通过正常手段在ubuntu 22.04上安装ceph-deploy了，即使用pip强行安装也会因为软件源问题无法继续。

使用ceph-deploy初始化Ceph

[tip type="yellow"]社区已经停止维护ceph-deploy，笔者不建议您继续使用ceph-deploy部署Ceph。[/tip]
如果您使用ubuntu 20.04及更早的版本，您仍可以按照我之前写过的《用 Ceph 实现 K8s 集群数据持久化 #2》对Ceph集群进行初始化，本篇不再赘述重复内容。
安装完之后，您可以直接跳到使用ceph-deploy设置CephFS，无需查看cephadm的相关内容。

使用cephadm初始化Ceph

旧事物终究是要被新事物所取代的，所以我们还是得站起来向前看才是。

初始化软件环境

相较于ceph-deploy，cephadm采用了容器的形式部署Ceph，所以我们需要先初始化一下软件环境:

# 安装基础软件
sudo apt update
sudo apt install docker.io cephadm ceph-common ntp -y
# 同步时间
sudo systemctl start ntp
sudo hwclock --systohc

部署单点Ceph服务

抽一个看着顺眼的节点先一步安装Ceph，笔者此处选择ap-zj-storage-1。关于本篇实践涉及的节点组，本篇开头有说明，此处不再赘述。
找个地方放Ceph的文件:

sudo mkdir -p /etc/ceph
sudo cd /etc/ceph

由于Ceph具有可拓展性，所以此处我们可以先在一个节点上进行安装，然后拓展到其它节点。
我们先初始化一个节点上的monitor和manager组件:

# 192.168.100.11 <=> ap-zj-storage-1
sudo cephadm bootstrap --mon-ip 192.168.100.11

等待片刻，cephadm会拉取Ceph的Docker镜像并完成相关部署。
之后，cephadm会生成全局唯一的集群Ceph SSH Key以便管理，如未通过参数指定，公钥默认位于:

/etc/ceph/ceph.pub

将ceph.pub同步到其他节点的authorized_keys，必须保证cephadm能通过ssh控制另一台机器。

将单点集群拓展至多点

此时单点服务已经安装完成，应尽快拓展集群至其他节点，同步完SSH Key之后您可以直接使用ceph-common拓展集群节点:

sudo ceph orch host add ap-zj-storage-0

然后对monitor组件进行扩容:

# 确认monitor的数量为节点数量，本篇部署的Ceph集群共有两个节点，所以monitor数量定为2
sudo ceph orch apply mon 2
# 解除系统对monitor的自动平衡
sudo ceph orch apply mon --unmanaged
# 手动确认monitor部署在Ceph中的具体节点
sudo ceph orch apply mon "ap-zj-storage-1,ap-zj-storage-0"

然后就等吧，cephadm会逐步向各个节点分派组件，这可能需要5-10分钟。
完成之后，集群已经正确运行了Monitor和Manager组件，但是OSD组件仍然需要我们手动初始化。

确认组件的运行状态

在开始之前，您需要检查Ceph集群的健康状态:

sudo ceph -s

如果您和笔者一样遇到了下列错误:

clock skew detected on mon.xxx

您需要检查ntp服务是否正常运行，以及再次同步系统时钟。
一般来说，此时集群应该仍处于 HEALTH_WARN 状态，这个状态应该是由于OSD数量不达标造成的，我们接下来就会部署OSD组件。

部署OSD组件

首先查看一下可以作为OSD的组件:

sudo ceph orch device ls

笔者执行此命令的输出是:

ceph orch device ls
HOST             PATH      TYPE  DEVICE ID                   SIZE  AVAILABLE  REFRESHED  REJECT REASONS  
ap-zj-storage-0  /dev/sdb  ssd   QEMU_HARDDISK_drive-scsi2  1099G  Yes        2m ago                     
ap-zj-storage-0  /dev/sdc  ssd   QEMU_HARDDISK_drive-scsi1  1099G  Yes        2m ago                     
ap-zj-storage-1  /dev/sdb  ssd   QEMU_HARDDISK_drive-scsi2  1099G  Yes        2m ago                     
ap-zj-storage-1  /dev/sdc  ssd   QEMU_HARDDISK_drive-scsi1  1099G  Yes        2m ago

着重确认AVAILABLE这栏的数据为 Yes，如果可用性不对劲，需要关注REASONS一栏查找原因。
确认设备无误后，如果你想将所有磁盘都设为OSD，其实你可以当个懒人，让Ceph帮你操心这些事情:

sudo ceph orch apply osd --all-available-devices

这样Ceph就会将所有AVAILABLE=Yes的磁盘都设为OSD了，这同样需要等待5-10分钟，让系统自动操作。
当然，也有人想手动指定设备为OSD。如果你前面让Ceph帮你干了，那这边可不要再执行了:

sudo wipefs -af <DEVICE>
sudo ceph orch device zap <NODE> <DEVICE> --force
sudo ceph orch device ls
# 记得确认可用性
sudo ceph orch daemon add osd <NODE>:<DEVICE>

确认OSD正常运行

运行下列命令确认OSD正常运行:

sudo ceph osd tree

笔者的输出是:

ID  CLASS  WEIGHT   TYPE NAME                 STATUS  REWEIGHT  PRI-AFF
-1         4.00000  root default                                       
-3         2.00000      host ap-zj-storage-0                           
 0    ssd  1.00000          osd.0                 up   1.00000  1.00000
 2    ssd  1.00000          osd.2                 up   1.00000  1.00000
-5         2.00000      host ap-zj-storage-1                           
 1    ssd  1.00000          osd.1                 up   1.00000  1.00000
 3    ssd  1.00000          osd.3                 up   1.00000  1.00000

至此，Ceph的初始化就完成了。

用cephadm设置CephFS

创建CephFS对象

先初始化一下FS对象:

sudo ceph fs volume create zj_k8s_cephfs

此处没有指定OSD Pool对象，一般Ceph会自动创建，无需过多干预(干预了也会被自动balance掉...就没必要了吧)。
然后需要给FS对象创建MDS。

创建元数据服务器(MDS)

元数据服务器，即英文文献里的MetaData Server，简称MDS。由于CephFS是POSIX兼容的文件系统，在跨设备的集群化数据存储中，需要一个存储文件信息和提供指引的“向导”，这个“向导”就是MDS。MDS的性能将一定程度上决定CephFS系统整体的IO性能。
此处为了后续启动CephFS，我们需要先行创建MDS:

# 设置副本数量，部署服务
sudo ceph orch apply mds zj_k8s_cephfs --placement="2 ap-zj-storage-0 ap-zj-storage-1"

大多数情况下，设置该项后系统都会自动部署，需要等待一会。
如果等待后运行ceph orch ls后还是没看到MDS服务，则需要手动部署:

sudo ceph orch daemon add mds <FS Name> <MDS Node>

至此，Ceph集群内关于CephFS的部署基本告一段落，下面是ceph-deploy的部署方式，用cephadm部署的话可以不看。

用ceph-deploy设置CephFS

[tip type="yellow"]社区已经停止维护ceph-deploy，笔者此处不建议您继续使用ceph-deploy部署Ceph。[/tip]

创建MDS

sudo ceph-deploy mds create <Node0> <Node1> <Node2>

创建OSD Pool

# 创建CephFS存储数据的OSD Pool
sudo ceph osd pool create <FS Data OSD Pool> 32
# 创建CephMDS存储元数据的OSD Pool
sudo ceph osd pool create <MetaData OSD Pool> 32

创建FS对象

ceph fs new <FS Name> <MetaData OSD Pool> <FS Data OSD Pool>

至此，Ceph集群内关于CephFS的部署基本告一段落。

最后修改：2025 年 01 月 15 日

如果这对你有用，我乐意之至。

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

ZnCookie
c44 tql (☆ω☆) 不过为什么网站不开启强制http...
cong
同样作为1名高一学生,我会的东西真是太少太少。在以前，我自以为...
itakashi
标题：梦潇の秘密花园链接：https://itakashi.i...
itakashi
好强，我果然是社会废人 ::(心碎)
庄先生
感谢技术分享，加油！

从零开始的K8s生产实践 #1 基础环境安装-Ceph和CephFS

0xC4A1 • 2023 年 01 月 07 日

<h2>前言</h2><p>前面我们提到过采用Ceph作为持久化存储实现，本篇将讲述Ceph的部署<del>和Ceph-CSI在Kubernetes集群以DaemonSet形式的部署</del>太长了留到下一篇再讲。  <br>本篇中提到的任何IP均可在前述的<a href="https://c4a15wh.cn/index.php/archives/65/#%E5%AE%9E%E6%93%8D%E7%8E%AF%E5%A2%83%E5%A3%B0%E6%98%8E">部署环境机器表</a>中找到对应机器。</p><h2>实操</h2><h3>噩耗</h3><p>如果您跟笔者一样不幸地选择了Ubuntu 22.04作为承载业务的发行版，那么您可能无法通过同在Ubuntu 20.04上相似的手段对Ceph进行部署。<br><img src="https://c4a15wh.cn/usr/uploads/2023/01/1804346152.png" alt="10020-tio89o45hx.png" title="10020-tio89o45hx.png" style=""><br>由于社区已经停止维护ceph-deploy，我们已经没有办法通过正常手段在ubuntu 22.04上安装ceph-deploy了，即使用pip强行安装也会因为软件源问题无法继续。</p><h3>使用ceph-deploy初始化Ceph</h3><p>[tip type="yellow"]社区已经停止维护ceph-deploy，笔者不建议您继续使用ceph-deploy部署Ceph。[/tip]<br>如果您使用ubuntu 20.04及更早的版本，您仍可以按照我之前写过的<a href="https://c4a15wh.cn/index.php/archives/47/">《用 Ceph 实现 K8s 集群数据持久化 #2》</a>对Ceph集群进行初始化，本篇不再赘述重复内容。  <br>安装完之后，您可以直接跳到<a href="https://c4a15wh.cn/index.php/archives/68/#%E7%94%A8ceph-deploy%E8%AE%BE%E7%BD%AECephFS">使用ceph-deploy设置CephFS</a>，无需查看cephadm的相关内容。</p><h3>使用cephadm初始化Ceph</h3><p>旧事物终究是要被新事物所取代的，所以我们还是得站起来向前看才是。</p><h4>初始化软件环境</h4><p>相较于ceph-deploy，cephadm采用了容器的形式部署Ceph，所以我们需要先初始化一下软件环境:</p><pre><code># 安装基础软件
sudo apt update
sudo apt install docker.io cephadm ceph-common ntp -y
# 同步时间
sudo systemctl start ntp
sudo hwclock --systohc</code></pre><h4>部署单点Ceph服务</h4><p>抽一个看着顺眼的节点先一步安装Ceph，笔者此处选择ap-zj-storage-1。关于本篇实践涉及的节点组，本篇开头有说明，此处不再赘述。<br>找个地方放Ceph的文件:</p><pre><code>sudo mkdir -p /etc/ceph
sudo cd /etc/ceph</code></pre><p>由于Ceph具有可拓展性，所以此处我们可以先在一个节点上进行安装，然后拓展到其它节点。<br>我们先初始化一个节点上的monitor和manager组件:</p><pre><code># 192.168.100.11 &lt;=&gt; ap-zj-storage-1
sudo cephadm bootstrap --mon-ip 192.168.100.11</code></pre><p>等待片刻，cephadm会拉取Ceph的Docker镜像并完成相关部署。  <br>之后，cephadm会生成全局唯一的集群Ceph SSH Key以便管理，如未通过参数指定，公钥默认位于:</p><pre><code>/etc/ceph/ceph.pub</code></pre><p>将ceph.pub同步到其他节点的authorized_keys，<strong>必须保证cephadm能通过ssh控制另一台机器</strong>。</p><h4>将单点集群拓展至多点</h4><p>此时单点服务已经安装完成，应尽快拓展集群至其他节点，同步完SSH Key之后您可以直接使用ceph-common拓展集群节点:</p><pre><code>sudo ceph orch host add ap-zj-storage-0</code></pre><p>然后对monitor组件进行扩容:</p><pre><code># 确认monitor的数量为节点数量，本篇部署的Ceph集群共有两个节点，所以monitor数量定为2
sudo ceph orch apply mon 2
# 解除系统对monitor的自动平衡
sudo ceph orch apply mon --unmanaged
# 手动确认monitor部署在Ceph中的具体节点
sudo ceph orch apply mon &quot;ap-zj-storage-1,ap-zj-storage-0&quot;</code></pre><p>然后就等吧，cephadm会逐步向各个节点分派组件，这可能需要5-10分钟。  <br>完成之后，集群已经正确运行了Monitor和Manager组件，但是OSD组件仍然需要我们手动初始化。</p><h4>确认组件的运行状态</h4><p>在开始之前，您需要检查Ceph集群的健康状态:</p><pre><code>sudo ceph -s</code></pre><p>如果您和笔者一样遇到了下列错误:</p><pre><code>clock skew detected on mon.xxx</code></pre><p>您需要检查ntp服务是否正常运行，以及再次同步系统时钟。<br>一般来说，此时集群应该仍处于 HEALTH_WARN 状态，这个状态应该是由于OSD数量不达标造成的，我们接下来就会部署OSD组件。</p><h4>部署OSD组件</h4><p>首先查看一下可以作为OSD的组件:</p><pre><code>sudo ceph orch device ls</code></pre><p>笔者执行此命令的输出是:</p><pre><code>ceph orch device ls
HOST             PATH      TYPE  DEVICE ID                   SIZE  AVAILABLE  REFRESHED  REJECT REASONS  
ap-zj-storage-0  /dev/sdb  ssd   QEMU_HARDDISK_drive-scsi2  1099G  Yes        2m ago                     
ap-zj-storage-0  /dev/sdc  ssd   QEMU_HARDDISK_drive-scsi1  1099G  Yes        2m ago                     
ap-zj-storage-1  /dev/sdb  ssd   QEMU_HARDDISK_drive-scsi2  1099G  Yes        2m ago                     
ap-zj-storage-1  /dev/sdc  ssd   QEMU_HARDDISK_drive-scsi1  1099G  Yes        2m ago</code></pre><p>着重确认AVAILABLE这栏的数据为 Yes，如果可用性不对劲，需要关注REASONS一栏查找原因。<br>确认设备无误后，如果你想将所有磁盘都设为OSD，其实你可以当个懒人，让Ceph帮你操心这些事情:</p><pre><code>sudo ceph orch apply osd --all-available-devices</code></pre><p>这样Ceph就会将所有AVAILABLE=Yes的磁盘都设为OSD了，这同样需要等待5-10分钟，让系统自动操作。<br>当然，也有人想手动指定设备为OSD。如果你前面让Ceph帮你干了，那这边可不要再执行了:</p><pre><code>sudo wipefs -af &lt;DEVICE&gt;
sudo ceph orch device zap &lt;NODE&gt; &lt;DEVICE&gt; --force
sudo ceph orch device ls
# 记得确认可用性
sudo ceph orch daemon add osd &lt;NODE&gt;:&lt;DEVICE&gt;</code></pre><h4>确认OSD正常运行</h4><p>运行下列命令确认OSD正常运行:</p><pre><code>sudo ceph osd tree</code></pre><p>笔者的输出是:</p><pre><code>ID  CLASS  WEIGHT   TYPE NAME                 STATUS  REWEIGHT  PRI-AFF
-1         4.00000  root default                                       
-3         2.00000      host ap-zj-storage-0                           
 0    ssd  1.00000          osd.0                 up   1.00000  1.00000
 2    ssd  1.00000          osd.2                 up   1.00000  1.00000
-5         2.00000      host ap-zj-storage-1                           
 1    ssd  1.00000          osd.1                 up   1.00000  1.00000
 3    ssd  1.00000          osd.3                 up   1.00000  1.00000</code></pre><p>至此，Ceph的初始化就完成了。</p><h3>用cephadm设置CephFS</h3><h4>创建CephFS对象</h4><p>先初始化一下FS对象:</p><pre><code>sudo ceph fs volume create zj_k8s_cephfs</code></pre><p>此处没有指定OSD Pool对象，一般Ceph会自动创建，无需过多干预(干预了也会被自动balance掉...就没必要了吧)。<br>然后需要给FS对象创建MDS。</p><h4>创建元数据服务器(MDS)</h4><p>元数据服务器，即英文文献里的MetaData Server，简称MDS。由于CephFS是POSIX兼容的<strong>文件系统</strong>，在跨设备的集群化数据存储中，需要一个存储文件信息和提供指引的“向导”，这个“向导”就是MDS。MDS的性能将<strong>一定程度上决定</strong>CephFS系统整体的IO性能。<br>此处为了后续启动CephFS，我们需要先行创建MDS:</p><pre><code># 设置副本数量，部署服务
sudo ceph orch apply mds zj_k8s_cephfs --placement=&quot;2 ap-zj-storage-0 ap-zj-storage-1&quot;</code></pre><p>大多数情况下，设置该项后系统都会自动部署，需要等待一会。  <br>如果等待后运行<strong>ceph orch ls</strong>后还是没看到MDS服务，则需要手动部署:</p><pre><code>sudo ceph orch daemon add mds &lt;FS Name&gt; &lt;MDS Node&gt;</code></pre><p>至此，Ceph集群内关于CephFS的部署基本告一段落，下面是ceph-deploy的部署方式，用cephadm部署的话可以不看。</p><h3>用ceph-deploy设置CephFS</h3><p>[tip type="yellow"]社区已经停止维护ceph-deploy，笔者此处不建议您继续使用ceph-deploy部署Ceph。[/tip]</p><h4>创建MDS</h4><pre><code>sudo ceph-deploy mds create &lt;Node0&gt; &lt;Node1&gt; &lt;Node2&gt;</code></pre><h4>创建OSD Pool</h4><pre><code># 创建CephFS存储数据的OSD Pool
sudo ceph osd pool create &lt;FS Data OSD Pool&gt; 32
# 创建CephMDS存储元数据的OSD Pool
sudo ceph osd pool create &lt;MetaData OSD Pool&gt; 32</code></pre><h4>创建FS对象</h4><pre><code>ceph fs new &lt;FS Name&gt; &lt;MetaData OSD Pool&gt; &lt;FS Data OSD Pool&gt;</code></pre><p>至此，Ceph集群内关于CephFS的部署基本告一段落。</p>

从零开始的K8s生产实践 #1 基础环境安装-Ceph和CephFS

前言

实操

噩耗

使用ceph-deploy初始化Ceph

使用cephadm初始化Ceph

初始化软件环境

部署单点Ceph服务

将单点集群拓展至多点

确认组件的运行状态

部署OSD组件

确认OSD正常运行

用cephadm设置CephFS

创建CephFS对象

创建元数据服务器(MDS)

用ceph-deploy设置CephFS

创建MDS

创建OSD Pool

创建FS对象

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

关于Golang深拷贝的二三事

华为openEuler初体验#1-操作系统安装

一点随笔: 关于少子化和老龄化问题

记一次网站主题debug

客户端gRPC服务负载均衡在Kubernetes中的实现

WireGuard RTNETLINK answers: Address already in use 问题解法

关于华为TOA模块编译失败问题的解决方案

使用KubeKey变更IP安装K8s时存在的问题

安装GPU及配置环境的注意事项

Docker错误: could not select device driver "" with capabilities: [[gpu]].

从零开始的K8s生产实践 #1 基础环境安装-Ceph和CephFS

前言

实操

噩耗

使用ceph-deploy初始化Ceph

使用cephadm初始化Ceph

初始化软件环境

部署单点Ceph服务

将单点集群拓展至多点

确认组件的运行状态

部署OSD组件

确认OSD正常运行

用cephadm设置CephFS

创建CephFS对象

创建元数据服务器(MDS)

用ceph-deploy设置CephFS

创建MDS

创建OSD Pool

创建FS对象

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

从零开始的K8s生产实践 #1 基础环境安装-Ceph和CephFS

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款