docker_practice/mesos/installation.md

388 lines
15 KiB
Go
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## Mesos 安装与使用
Mesos 结合 Marathon 应用框架为例来看下如何快速搭建一套 Mesos 平台
Marathon 是可以跟 Mesos 一起协作的一个 framework基于 Scala 实现可以实现保持应用的持续运行
另外Mesos 默认利用 ZooKeeper 来进行多个主节点之间的选举以及从节点发现主节点的过程一般在生产环境中需要启动多个 Mesos master 服务推荐 3 5 并且推荐使用 supervisord 等进程管理器来自动保持服务的运行
ZooKeeper 是一个分布式集群中信息同步的工具通过自动在多个节点中选举 `leader`保障多个节点之间的某些信息保持一致性
### 安装
安装主要需要 mesoszookeeper marathon 三个软件包
Mesos 也采用了经典的主-从结构一般包括若干主节点和大量从节点其中mesos master 服务和 zookeeper 需要部署到所有的主节点mesos slave 服务需要部署到所有从节点marathon 可以部署到主节点
安装可以通过源码编译软件源或者 Docker 镜像方式进行下面分别进行介绍
#### 源码编译
源码编译方式可以保障获取到最新版本但编译过程比较费时间
首先 apache.org 开源网站下载最新的源码
```sh
$ git clone https://git-wip-us.apache.org/repos/asf/mesos.git
```
其中主要代码在 `src` 目录下应用框架代码在 `frameworks` 目录下文档在 `docs` 目录下`include ` 中包括了跟 Mesos 打交道使用的一些 API 定义头文件
安装依赖主要包括 Java 运行环境Linux 上的自动编译环境等
```sh
$ sudo apt-get update
$ sudo apt-get install -y openjdk-8-jdk autoconf libtool \
build-essential python-dev python-boto libcurl4-nss-dev \
libsasl2-dev maven libapr1-dev libsvn-dev
```
后面就是常规 C++ 项目的方法configure 之后利用 Makefile 进行编译和安装
```sh
$ cd mesos
$ ./bootstrap
$ mkdir build
$ cd build && ../configure --with-network-isolator
$ make
$ make check && sudo make install
```
#### 软件源安装
通过软件源方式进行安装相对会省时间但往往不是最新版本
这里以 Ubuntu 系统为例首先添加软件源地址
```sh
$ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv E56151BF
$ DISTRO=$(lsb_release -is | tr '[:upper:]' '[:lower:]')
$ CODENAME=$(lsb_release -cs)
$ echo "deb http://repos.mesosphere.io/${DISTRO} ${CODENAME} main" | \
sudo tee /etc/apt/sources.list.d/mesosphere.list
```
刷新本地软件仓库信息并安装 zookeepermesosmarathon 三个软件包
```sh
$ sudo apt-get -y update && sudo apt-get -y install zookeeper mesos marathon
```
注意Marathon 最新版本需要 jdk 1.8+ 的支持如果系统中有多个 Java 版本需要检查配置默认的 JDK 版本符合要求
```sh
$ sudo update-alternatives --config java
```
安装 Mesos 成功后会在 `/usr/sbin/` 下面发现 `mesos-master` `mesos-slave` 两个二进制文件分别对应主节点上需要运行的管理服务和从节点上需要运行的任务服务
用户可以手动运行二进制文件启动服务也可以通过 `service` 命令来方便进行管理
例如在主节点上重启 Mesos 管理服务
```sh
$ sudo service mesos-master restart
```
通过 `service` 命令来管理实际上是通过调用 `/usr/bin/mesos-init-wrapper` 脚本文件进行处理
#### [基于 Docker](https://github.com/sekka1/mesosphere-docker)
需要如下三个镜像
* ZooKeeperhttps://registry.hub.docker.com/u/garland/zookeeper/
* Mesoshttps://registry.hub.docker.com/u/garland/mesosphere-docker-mesos-master/
* Marathonhttps://registry.hub.docker.com/u/garland/mesosphere-docker-marathon/
其中 mesos-master 镜像在后面将分别作为 master slave 角色进行使用
首先拉取三个镜像
```sh
$ docker pull garland/zookeeper
$ docker pull garland/mesosphere-docker-mesos-master
$ docker pull garland/mesosphere-docker-marathon
```
导出主节点机器的地址到环境变量
```sh
$ HOST_IP=10.0.0.2
```
在主节点上启动 Zookeepr 容器
```sh
docker run -d \
-p 2181:2181 \
-p 2888:2888 \
-p 3888:3888 \
garland/zookeeper
```
在主节点上启动 Mesos Master 服务容器
```sh
docker run --net="host" \
-p 5050:5050 \
-e "MESOS_HOSTNAME=${HOST_IP}" \
-e "MESOS_IP=${HOST_IP}" \
-e "MESOS_ZK=zk://${HOST_IP}:2181/mesos" \
-e "MESOS_PORT=5050" \
-e "MESOS_LOG_DIR=/var/log/mesos" \
-e "MESOS_QUORUM=1" \
-e "MESOS_REGISTRY=in_memory" \
-e "MESOS_WORK_DIR=/var/lib/mesos" \
-d \
garland/mesosphere-docker-mesos-master
```
在主节点上启动 Marathon
```sh
docker run \
-d \
-p 8080:8080 \
garland/mesosphere-docker-marathon --master zk://${HOST_IP}:2181/mesos --zk zk://${HOST_IP}:2181/marathon
```
在从节点上启动 Mesos slave 容器
```sh
docker run -d \
--name mesos_slave_1 \
--entrypoint="mesos-slave" \
-e "MESOS_MASTER=zk://${HOST_IP}:2181/mesos" \
-e "MESOS_LOG_DIR=/var/log/mesos" \
-e "MESOS_LOGGING_LEVEL=INFO" \
garland/mesosphere-docker-mesos-master:latest
```
接下来可以通过访问本地 8080 端口来使用 Marathon 启动任务了
### 配置说明
下面以本地通过软件源方式安装为例解释如何修改各个配置文件
#### ZooKeepr
ZooKeepr 是一个分布式应用的协调工具用来管理多个主节点的选举和冗余监听在 2181 端口推荐至少布置三个主节点来被 ZooKeeper 维护
配置文件默认都在 `/etc/zookeeper/conf/` 目录下比较关键的配置文件有两个`myid` `zoo.cfg`
myid 文件会记录加入 ZooKeeper 集群的节点的序号1-255之间`/var/lib/zookeeper/myid` 文件其实也是软连接到了该文件
比如配置某节点序号为 1则需要在该节点上执行
```sh
$ echo 1 | sudo dd of=/etc/zookeeper/conf/myid
```
节点序号在 ZooKeeper 集群中必须唯一不能出现多个拥有相同序号的节点
另外需要修改 zoo.cfg 文件该文件是主配置文件主要需要添加上加入 ZooKeeper 集群的机器的序号和对应监听地址
例如现在 ZooKeeper 集群中有三个节点地址分别为 `10.0.0.2``10.0.0.3``10.0.0.4`序号分别配置为 `2``3``4`
则配置如下的三行
```sh
server.2=10.0.0.2:2888:3888
server.3=10.0.0.3:2888:3888
server.4=10.0.0.4:2888:3888
```
其中第一个端口 2888 负责从节点连接到主节点的第二个端口 3888 则负责主节点进行选举时候通信
也可以用主机名形式则需要各个节点 `/etc/hosts` 文件中都记录地址到主机名对应的映射关系
完成配置后启动 ZooKeeper 服务
```sh
$ sudo service zookeeper start
```
#### Mesos
Mesos 的默认配置目录有三个
* /etc/mesos/主节点和从节点都会读取的配置文件最关键的是 zk 文件存放主节点的信息
* /etc/mesos-master/只有主节点会读取的配置等价于启动 mesos-master 命令时候的默认选项
* /etc/mesos-slave/只有从节点会读取的配置等价于启动 mesos-master 命令时候的默认选项
最关键的是需要在所有节点上修改 `/etc/mesos/zk`写入主节点集群的 ZooKeeper 地址列表例如
```sh
zk://10.0.0.2:2181,10.0.0.3:2181,10.0.0.4:2181/mesos
```
此外`/etc/default/mesos``/etc/default/mesos-master``/etc/default/mesos-slave` 这三个文件中可以存放一些环境变量定义Mesos 服务启动之前会将这些环境变量导入进来作为启动参数格式为 `MESOS_OPTION_NAME`
下面分别说明在主节点和从节点上的配置
##### 主节点
一般只需要关注 `/etc/mesos-master/` 目录下的文件默认情况下目录下为空
该目录下文件命名和内容需要跟 mesos-master 支持的命令行选项一一对应可以通过 `mesos-master --help` 命令查看支持的选项
例如某个文件 `key` 中内容为 `value`则在 mesos-master 服务启动的时候会自动添加参数 `--key=value` 给二进制命令
例如mesos-master 服务默认监听在 loopback 端口 `127.0.0.1:5050`我们需要修改主节点监听的地址则可以创建 /etc/mesos-master/ip 文件在其中写入主节点监听的外部地址
为了正常启动 mesos-master 服务还需要指定 `work_dir` 参数(表示应用框架的工作目录)的值可以通过创建 /etc/mesos-master/work_dir 文件在其中写入目录例如 ` /var/lib/mesos`工作目录下会生成一个 `replicated_log` 目录会存有各种同步状态的持久化信息
以及指定 quorum 参数的值该参数用来表示 ZooKeeper 集群中要求最少参加表决的节点数目一般设置为比 ZooKeeper 集群中节点个数的半数多一些比如三个节点的话可以配置为 `2`
此外要修改 Mesos 集群的名称可以创建 `/etc/mesos-master/cluster` 文件在其中写入集群的别名例如 `MesosCluster`
总结下建议在 `/etc/mesos-master` 目录下配置至少四个参数文件`ip``quorum``work_dir``cluster`
修改配置之后需要启动服务即可生效
```sh
$ sudo service mesos-master start
```
更多选项可以参考后面的配置项解析章节
主节点服务启动后则可以在从节点上启动 mesos-slave 服务来加入主节点的管理
##### 从节点
一般只需要关注 `/etc/mesos-slave/` 目录下的文件默认情况下目录下为空
文件命名和内容也是跟主节点类似对应二进制文件支持的命令行参数
建议在从节点上创建 `/etc/mesos-slave/ip` 文件在其中写入跟主节点通信的地址
修改配置之后也需要重新启动服务
```sh
$ sudo service mesos-slave start
```
更多选项可以参考后面的配置项解析章节
#### Marathon
Marathon 作为 Mesos 的一个应用框架配置要更为简单必需的配置项有 `--master` `--zk`
安装完成后会在 /usr/bin 下多一个 marathon shell 脚本为启动 marathon 时候执行的命令
配置目录为 `/etc/marathon/conf`需要手动创建此外默认配置文件在 `/etc/default/marathon`
我们手动创建配置目录并添加配置项文件命名和内容跟 Mesos 风格一致 Marathon 能连接到已创建的 Mesos 集群中
```sh
$ sudo mkdir -p /etc/marathon/conf
$ sudo cp /etc/mesos/zk /etc/marathon/conf/master
```
同时 Marathon 也将自身的状态信息保存到 ZooKeeper 创建 `/etc/marathon/conf/zk` 文件添加 ZooKeeper 地址和路径
```sh
zk://10.0.0.2:2181,10.0.0.2:2181,10.0.0.2:2181/marathon
```
启动 marathon 服务
```sh
$ sudo service marathon start
```
### 访问 Mesos 图形界面
Mesos 自带了 Web 图形界面可以方便用户查看集群状态
用户在 Mesos 主节点服务和从节点服务都启动后可以通过浏览器访问主节点 5050 端口看到类似如下界面已经有两个 slave 节点加入了
![mesos 界面查看加入的 slave 节点](_images/mesos.png)
通过 Slaves 标签页能看到加入集群的从节点的信息
如果没有启动 Marathon 服务 Frameworks 标签页下将看不到任何内容
### 访问 Marathon 图形界面
Marathon 服务启动成功后 Mesos web 界面的 Frameworks 标签页下面将能看到名称为 marathon 的框架出现
同时可以通过浏览器访问 8080 端口看到 Marathon 自己的管理界面
![marathon 图形管理界面](_images/marathon.png)
此时可以通过界面或者 REST API 来创建一个应用Marathon 会保持该应用的持续运行
![marathon 查看任务支持的参数](_images/marathon_basic0.png)
通过界面方式可以看到各任务支持的参数包括资源命令环境变量健康检查等同时可以很容易地修改任务运行实例数进行扩展非常适合进行测试
如果要更自动化地使用 Marathon则需要通过它的 REST API 进行操作
一般的启动新任务需要先创建一个定义模板JSON 格式然后发到指定的 API
例如示例任务 basic-0 的定义模板为
```json
{
"id": "basic-0",
"cmd": "while [ true ] ; do echo 'Hello Marathon' ; sleep 5 ; done",
"cpus": 0.1,
"mem": 10.0,
"instances": 1
}
```
该任务申请资源为 0.1 个单核 CPU 资源和 10 MB 的内存资源具体命令为每隔五秒钟用 shell 打印一句 `Hello Marathon`
可以通过如下命令发出 basic-0 任务到 Marathon 框架框架会分配任务到某个满足条件的从节点上成功会返回一个 json 对象描述任务的详细信息
```sh
$ curl -X POST http://marathon_host:8080/v2/apps -d @basic-0.json -H "Content-type: application/json"
{"id":"/basic-0","cmd":"while [ true ] ; do echo 'Hello Marathon' ; sleep 5 ; done","args":null,"user":null,"env":{},"instances":1,"cpus":0.1,"mem":10,"disk":0,"executor":"","constraints":[],"uris":[],"storeUrls":[],"ports":[0],"requirePorts":false,"backoffSeconds":1,"backoffFactor":1.15,"maxLaunchDelaySeconds":3600,"container":null,"healthChecks":[],"dependencies":[],"upgradeStrategy":{"minimumHealthCapacity":1,"maximumOverCapacity":1},"labels":{},"acceptedResourceRoles":null,"version":"2015-12-28T05:33:05.805Z","tasksStaged":0,"tasksRunning":0,"tasksHealthy":0,"tasksUnhealthy":0,"deployments":[{"id":"3ec3fbd5-11e4-479f-bd17-813d33e43e0c"}],"tasks":[]}%
```
Marathon 的更多 REST API 可以参考本地自带的文档`http://marathon_host:8080/api-console/index.html`
此时如果运行任务的从节点出现故障任务会自动在其它可用的从节点上启动
此外目前也已经支持基于 Docker 容器的任务需要先在 Mesos slave 节点上为 slave 服务配置 `--containerizers=docker,mesos` 参数
例如如下面的示例任务
```json
{
"id": "basic-3",
"cmd": "python3 -m http.server 8080",
"cpus": 0.5,
"mem": 32.0,
"container": {
"type": "DOCKER",
"volumes": [],
"docker": {
"image": "python:3",
"network": "BRIDGE",
"portMappings": [
{
"containerPort": 8080,
"hostPort": 31000,
"servicePort": 0,
"protocol": "tcp"
}
],
"privileged": false,
"parameters": [],
"forcePullImage": true
}
}
}
```
该任务启动一个 `python:3` 容器执行 `python3 -m http.server 8080` 命令作为一个简单的 web 服务实际端口会映射到宿主机的 31000 端口
注意区分 hostPort servicePort前者代表任务映射到的本地可用端口可用范围由 Mesos slave 汇报默认为 31000 ~ 32000后者作为服务管理的端口可以被用作一些服务发行机制使用进行转发在整个 Marathon 集群中是唯一的
任务执行后也可以在对应 slave 节点上通过 Docker 命令查看容器运行情况容器将以 `mesos-SLAVE_ID` 开头
```sh
$ docker container ls
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
1226b4ec8d7d python:3 "/bin/sh -c 'python3 " 3 days ago Up 3 days 0.0.0.0:10000->8080/tcp mesos-06db0fba-49dc-4d28-ad87-6c2d5a020866-S10.b581149e-2c43-46a2-b652-1a0bc10204b3
```