mafeifan 的编程技术分享

功能介绍

Fri, 16 Jan 2026 08:51:04 GMT

功能介绍

Amazon EKS Pod Identity 是 AWS 对 EKS 原有的 IAM roles for service accounts (IRSA) 功能的补充，通过新增的 EKS Pod Identity 功能，用户可以用更简便的方式实现为 Pod 安全的授予 AWS API 访问权限，并且所有的配置管理操作都可以通过 AWS API 或者控制台完成。

使用方法

新建个 IAM role，信任实体如下

json

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "Service": "pods.eks.amazonaws.com"
            },
            "Action": [
                "sts:AssumeRole",
                "sts:TagSession"
            ]
        }
    ]
}

分配策略比如:

json

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject",
                "s3:ListBucket"
            ],
            "Resource": "arn:aws:s3:::artifacts"
        }
    ]
}

EKS 集群需要安装 eks-pod-identity-agent 组件（支持通过控制台安装）。

bash

aws eks create-addon \
--cluster-name <CLUSTER_NAME> \
--addon-name eks-pod-identity-agent \
--addon-version v1.x.x-eksbuild.1

创建 K8s Service Account

yaml

apiVersion: v1
kind: ServiceAccount
metadata:
  name: my-service-account
  namespace: default

然后，需要配置应用 Pod 所使用的 Service Account 与 AWS IAM 角色之间的关联关系，允许使用该 Service Account 的应用扮演特定的 IAM 角色（支持通过控制台配置）。

bash

aws eks create-pod-identity-association \
  --cluster-name <CLUSTER_NAME> \
  --namespace <NAMESPACE> \
  --service-account <SERVICE_ACCOUNT_NAME> \
  --role-arn <IAM_ROLE_ARN>

最关键的，应用 Pod 需要更新使用最新的支持 EKS Pod Identity 特性的 AWS SDK 比如应用 Pod 是 Java开发的，需要调用 S3 API，那么需要更新 pom.xml 文件，添加 AWS SDK,AWS SDK 中有一套获取凭证的默认搜索逻辑或者显示调用 EKS Pod Identity 依赖的Container credential provide
运行应用 Pod, 我们来创建一个简单的应用 Pod

yaml

apiVersion: apps/v1
kind: Deployment
metadata:
  name: my-app
spec:
  selector:
    matchLabels:
      app: my-app
  template:
    metadata:
      labels:
        app: my-app
    spec:
      serviceAccountName: my-service-account
      containers:
      - name: my-app
        image: public.ecr.aws/aws-cli/aws-cli:2.32.12
        command:
          - sh
          - '-c'
          - while true; do sleep 3600; done

测试,发现有S3桶内容返回,如果把 s3:ListBucket action 拿掉则报错, 测试通过

kubectl exec -it deployment/my-app -- aws s3 ls s3://artifacts/

工作流程

当用户/Controller 向 apiserver 提交 Pod 时，会触发 eks-pod-identity-webhook 的 mutating webhook 流程。
eks-pod-identity-webhook 的 mutating webhook 流程会为 Pod 挂载 service account oidc token 文件以及配置环境变量 (AWS_CONTAINER_AUTHORIZATION_TOKEN_FILE, AWS_CONTAINER_CREDENTIALS_FULL_URI ）。

通过 kubectl describe pod my-app-77f6749799-f26hf 可以看到

    Environment:
      AWS_STS_REGIONAL_ENDPOINTS:              regional
      AWS_DEFAULT_REGION:                      eu-west-1
      AWS_REGION:                              eu-west-1
      AWS_CONTAINER_CREDENTIALS_FULL_URI:      http://169.254.170.23/v1/credentials
      AWS_CONTAINER_AUTHORIZATION_TOKEN_FILE:  /var/run/secrets/pods.eks.amazonaws.com/serviceaccount/eks-pod-identity-token
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-jtjst (ro)
      /var/run/secrets/pods.eks.amazonaws.com/serviceaccount from eks-pod-identity-token (ro)

打印 service account oidc token 文件，kubectl exec -it deployment/my-app -- cat /var/run/secrets/pods.eks.amazonaws.com/serviceaccount/eks-pod-identity-token 是 JWT 格式的,找一个在线解密 https://www.jwt.io/ 获得

## header

{
  "alg": "RS256",
  "kid": "167335cb436b4080252a64e070f6d3153f896845"
}

## payload
iss (Issuer)：签发者
sub (Subject)：主题
aud (Audience)：接收者
exp (Expiration time)：过期时间
nbf (Not Before)：生效时间
iat (Issued At)：签发时间
jti (JWT ID)：编号

{
  "aud": [
    "pods.eks.amazonaws.com"
  ],
  "exp": 1765334133,
  "iat": 1765252458,
  "iss": "https://oidc.eks.eu-west-1.amazonaws.com/id/43E064763DAXXXXD18392C7FC9CBEA3A",
  "jti": "5e081212-fdf6-425c-9b32-c9a372112fd9",
  "kubernetes.io": {
    "namespace": "default",
    "node": {
      "name": "ip-172-31-77-99.eu-west-1.compute.internal",
      "uid": "797b365b-3491-47a6-a222-ba5acf3276d8"
    },
    "pod": {
      "name": "my-app-77f6749799-f26hf",
      "uid": "8768b78a-298a-4bf5-95b4-07a181ccbc2a"
    },
    "serviceaccount": {
      "name": "my-service-account",
      "uid": "92a8c128-7c32-4199-be85-1f2669cf7914"
    }
  },
  "nbf": 1765252458,
  "sub": "system:serviceaccount:default:my-service-account"
}

Pod 容器内的应用使用的 AWS SDK 将使用通过环境变量 AWS_CONTAINER_AUTHORIZATION_TOKEN_FILE 获取的 service account oidc token 访问环境变量 AWS_CONTAINER_CREDENTIALS_FULL_URI 指向的地址（http://169.254.170.23/v1/credentials）获取 AWS sts token。

curl $AWS_CONTAINER_CREDENTIALS_FULL_URI -H "Authorization: $(cat $AWS_CONTAINER_AUTHORIZATION_TOKEN_FILE)" 2>/dev/null | jq

{
  "AccessKeyId": "ASXXXXXXXXXXXXX",
  "SecretAccessKey": "zEuXXXXXXXX",
  "Token": "IQoJb3JpXXXXXXX",
  "AccountId": "5XXXXXXXXXXX",
  "Expiration": "2025-12-09T09:54:37Z"
}

等效写法

bash

TOKEN=`kubectl exec -it deployment/my-app -- cat  /var/run/secrets/pods.eks.amazonaws.com/serviceaccount/eks-pod-identity-token`
aws eks-auth assume-role-for-pod-identity --cluster-name cluter-name --token $TOKEN

{
    "subject": {
        "namespace": "default",
        "serviceAccount": "my-service-account"
    },
    "audience": "pods.eks.amazonaws.com",
    "podIdentityAssociation": {
        "associationArn": "arn:aws:eks:eu-west-1:47111xxxxx:podidentityassociation/cluster-name/a-avrgufuj****",
        "associationId": "a-avrgufuj****"
    },
    "assumedRoleUser": {
        "arn": "arn:aws:sts::47111xxxxx:assumed-role/my-role/cluter-name-c-my-app-77f-8c3ec6dc-97****",
        "assumeRoleId": "AROAW****:eks-cluster-eks-c-my-app-77f-8c3ec6dc-97****"
    },
    "credentials": {
        "sessionToken": "IQoJb3JpZ2luX2VjEO///////////wEaCWV1LX****",
        "accessKeyId": "ASIAW****",
        "expiration": "2025-12-09T20:23:17+08:00"
    }
}

AWS_CONTAINER_CREDENTIALS_FULL_URI 的值为 http://169.254.170.23/v1/credentials。这个地址是固定的,是 EKS Pod Identity Agent 提供的本地 HTTP 端点。

169.254.170.23: EKS Pod Identity Agent 的固定端点

169.254.169.254: EC2 IMDS (Instance Metadata Service) 的固定端点

EKS Pod Identity Agent 作为 DaemonSet 运行在每个节点上,通过以下方式提供服务:

HostNetwork 模式: Agent 使用主机网络
本地监听: 在节点上监听 169.254.170.23:80
所有 Pod 可访问: 节点上的所有 Pod 都可以访问这个 IP

eks-pod-identity-agent 收到请求后，将使用传递过来的 oidc token 访问 EKS 新增的 AssumeRoleForPodIdentity API 获取所需的 AWS sts token，然后将获取到的 sts token 返回给客户端。

应用调用的 AWS SDK 使用获取到的 sts token 访问应用所需的 AWS 云产品 API。

简单描述：

Pod 读取 JWT 令牌文件 (/var/run/secrets/pods.eks.amazonaws.com/serviceaccount/eks-pod-identity-token)
AWS SDK 将令牌发送到 http://169.254.170.23/v1/credentials
EKS Pod Identity Agent 验证令牌并调用 AWS STS
返回临时 AWS 凭证 (AccessKeyId, SecretAccessKey, SessionToken)

参考

https://mozillazg.com/2023/12/security-deep-dive-into-aws-eks-pod-identity-feature.html

https://securitylabs.datadoghq.com/articles/eks-pod-identity-deep-dive/

Fri, 16 Jan 2026 08:00:00 GMT

https://roadmap.sh/

AWS S3 讲解

  ├── 1. S3 基础概念
  │   ├── 什么是 S3
  │   ├── 核心组件：Bucket + Object
  │   └── 适用场景
  │
  ├── 2. 存储类别 (Storage Classes)
  │   ├── Standard (标准)
  │   ├── Intelligent-Tiering (智能分层)
  │   ├── Glacier (归档)
  │   └── 成本优化对比
  │
  ├── 3. 核心功能
  │   ├── Versioning (版本控制)
  │   ├── Lifecycle (生命周期)
  │   ├── Encryption (加密)
  │   └── Static Website Hosting
  │
  ├── 4. 访问控制
  │   ├── Bucket Policy
  │   ├── IAM Policies
  │   ├── ACLs
  │   └── Block Public Access
  │
  ├── 5. 数据保护
  │   ├── Replication (复制)
  │   ├── Object Lock (对象锁定)
  │   └── 备份策略
  │
  └── 6. 最佳实践
      ├── 命名规范
      ├── 安全性
      └── 成本优化

详细大纲

什么是 Amazon S3？

对象存储服务：不同于块存储/文件存储
特点：无限容量、高持久性(11个9)、高可用
核心概念：
- Bucket（桶）：容器，类似文件夹顶级目录
- Object（对象）：文件 + 元数据 + 唯一键值

存储类别对比

存储类	适用场景	访问延迟	成本
S3 Standard	频繁访问的数据	毫秒级	高
S3 Intelligent-Tiering	访问模式未知/变化	毫秒级	中
S3 Glacier Instant Retrieval	极少访问，毫秒级检索	毫秒级	低
S3 Glacier Flexible Retrieval	长期归档	分钟级	更低
S3 Glacier Deep Archive	合规归档	小时级	最低

关键功能

版本控制 (Versioning)

保留对象多个版本
防止误删除、覆盖

生命周期策略 (Lifecycle)

自动将对象转移到低成本存储类
自动删除过期对象

静态网站托管

直接托管 HTML/CSS/JS
配合 CloudFront CDN

访问控制模型

安全层级（由外到内）

Block Public Access → 阻止公开访问
Bucket Policy → JSON 策略控制
IAM Policy → 用户/角色权限
ACL → 细粒度控制（较少用）
数据保护

跨区域复制 (CRR)：多区域灾备
同区域复制 (SRR)：合规/低延迟
S3 Object Lock：WORM 保护，防删除

定价模式

存储费：按 GB/月
请求费：PUT/GET/DELETE
数据传出：出桶才收费
S3 Glacier 检索费：注意隐藏成本

讲解建议

开场：用生活类比（Bucket = 仓库，Object = 箱子）
重点：存储类别选择 + 成本优化 + 安全性
互动：展示 AWS Console 实际操作
结尾：常见坑点 + 最佳实践清单

`=` 和 `:=` 的区别

Fri, 16 Jan 2026 08:00:00 GMT

`=` 和 `:=` 的区别

特性	`=`	`:=`
用途	给已声明变量赋值	声明并赋值新变量
类型	需要预先声明类型	自动类型推断
使用范围	包级别和函数内	仅函数内
重复声明	可以重复赋值	不能重复声明同名变量

实际开发建议

优先使用 :=：在函数内部，:= 更简洁
包级别变量用 var：全局变量必须用 var 声明
需要零值初始化时用 var：如 var count int (自动为0)
明确指定类型时用 var：如 var pi float32 = 3.14

为什么结构体作为函数参数，前面要加 *

减少内存开销如果不加 *，函数调用时会复制整个结构体，占用额外内存。使用 * 可以传递结构体的地址，避免复制，提高性能，尤其是结构体较大时。
修改原始结构体如果函数需要修改结构体的字段值，必须使用指针才能生效。不使用指针（即传值方式），函数内部对结构体的修改不会影响原始结构体。
一致性在 Go 中，方法可以有指针接收者（func (f *Family)）或值接收者（func (f Family)）。如果你希望无论调用者是结构体变量还是指针，都能统一处理，通常会使用指针接收者。

下面两个写法等价吗

bash

type Person struct {
	Name string
	Age  int
}

// 方法 - 表示这是 Person 的行为
func (p Person) say() {
  fmt.Println("hello world")
}

// 函数 - 表示这是一个独立的操作
func say(p Person) {
  fmt.Println("hello world")
}

// 方法调用 - 面向对象风格
person.say()

// 函数调用 - 函数式风格  
say(person)

any

any 是 interface{} 的别名，Go 1.18+ 引入 any 类型，它表示任何类型，包括 nil。

DevOps 知识图谱

Sat, 13 Dec 2025 10:41:31 GMT

DevOps 知识图谱

说明

节点大小：表示该主题的重要程度
节点标签：显示主题名称和文章数量
连线：表示主题之间的关联关系
交互：
- 拖拽节点调整位置
- 点击主题节点展开/收起文章列表
- 文章节点显示为绿色

统计数据

主题	文章数量
Jenkins	48
K8s	45
Docker	43
Prometheus	29
Linux	20
GithubActions	14
Ansible2	11
Terraform	4

关于本站

Sat, 13 Dec 2025 02:32:47 GMT

这是记录的是我的编程技术技术文章，你看到的页面是基于 vitepress 工具生成的。

我对技术比较有热情。对CI/CD，容器化，云原生，微服务架构，自动化都有一定的了解。

目前在某传统行业外企担任 DevOps Specialist，10余年开发+运维经验

对文章有疑问的，欢迎加v讨论问题，也欢迎提issue

关于本站

2025.12.12 统一图床地址
2024.06.15 支持生成RSS
2023.12.31 从vuepress转移到vitepress，更快的构建速度

animate API

Sat, 13 Dec 2025 02:32:47 GMT

使用jQuery创建动画是件非常容易的事情，只需要掌握提供的animate API

animate API

官网解释 animate api

javascript

$(selector).animate({params},[speed],[easing],[fn]);

params: 一组包含作为动画属性和终值的样式属性和及其值的集合
speed: 可以填三种预定速度之一的字符串("slow" 600ms,"normal" 400ms, "fast" 200ms)或者直接填毫秒数值，默认400
easing: 要使用的擦除效果的名称(需要插件支持). 默认jQuery提供"linear" 和 "swing".
fn: 在动画完成时执行的函数，每个元素执行一次

例子，点击按钮让这个元素偏移一定像素

javascript

$("button").click(function(){
  $("div").animate({left:'250px'});
});

slideUp 等二次封装的方法

其中，jQuery还提供了方便的方法,其实是语法糖,对animate方法的二次封装

hide，show分别修改元素的display属性为none和block

slideUp(收缩高度),slideDown(还原高度),本质是随时间修改元素的高度

fadeIn(淡入), fadeOut(淡出)，本质是随时间修改元素的opacity属性

详细的例子可以见w3school

jQuery自带效果有限，可以使用 jQuery Easing Plugin 另外jQuery UI 提供了更多的特效，如颤动，心跳，爆炸等

animate 队列

jQuery的animate还支持队列，逐帧播放

javascript

$("button").click(function(){
  var div=$("div");
  div.animate({left:'100px'},"slow");
  div.animate({fontSize:'3em'},"slow");
});

loop 循环播放

借助animate API最后一个callback参数，可以轻松实现无尽播放动画的效果。

html

<iframe height="265" style="width: 100%;" scrolling="no" title="jquery animation loop" src="https://codepen.io/mafeifan/embed/ExPJpRo?height=265&theme-id=light&default-tab=html,result" frameborder="no" allowtransparency="true" allowfullscreen="true">
  See the Pen <a href='https://codepen.io/mafeifan/pen/ExPJpRo'>jquery animation loop</a> by finley
  (<a href='https://codepen.io/mafeifan'>@mafeifan</a>) on <a href='https://codepen.io'>CodePen</a>.
</iframe>

使用场景

不支持loop
不支持滚动条滚动播放

Runtime API Examples

Sat, 13 Dec 2025 02:14:42 GMT

Runtime API Examples

This page demonstrates usage of some of the runtime APIs provided by VitePress.

The main useData() API can be used to access site, theme, and page data for the current page. It works in both .md and .vue files:

<script setup>
import { useData } from 'vitepress'

const { theme, page, frontmatter } = useData()
</script>

## Results

### Theme Data
<pre>{{ theme }}</pre>

### Page Data
<pre>{{ page }}</pre>

### Page Frontmatter
<pre>{{ frontmatter }}</pre>

Results

Theme Data

{{ theme }}

Page Data

{{ page }}

Page Frontmatter

{{ frontmatter }}

Check out the documentation for the full list of runtime APIs.

友情链接 & 优秀站点

Sat, 13 Dec 2025 02:14:42 GMT

友情链接 & 优秀站点

Markdown Extension Examples

Sat, 13 Dec 2025 02:14:42 GMT

Markdown Extension Examples

This page demonstrates some of the built-in markdown extensions provided by VitePress.

Syntax Highlighting

VitePress provides Syntax Highlighting powered by Shiki, with additional features like line-highlighting:

Input

```js{4}
export default {
  data () {
    return {
      msg: 'Highlighted!'
    }
  }
}
```

html

<ul>
  <li v-for="todo in todos" :key="todo.id">
    {{ todo.text }}
  </li>
</ul>

Output

export default {
  data () {
    return {
      msg: 'Highlighted!'
    }
  }
}

Custom Containers

Input

::: info
This is an info box.
:::

::: tip
This is a tip.
:::

::: warning
This is a warning.
:::

::: danger
This is a dangerous warning.
:::

::: details
This is a details block.
:::

Output

INFO

This is an info box.

TIP

This is a tip.

WARNING

This is a warning.

DANGER

This is a dangerous warning.

Details

Sat, 13 Dec 2025 02:14:42 GMT

ChatGPT 是 OpenAI 公司推出的一个基于人工智能的对话模型，由于开放给大致使用，所以迅速火遍全球他可以与用户进行对话，回答问题，生成文本，翻译文本，提供建议等。非常火爆。早用早享受。

使用 ChatGPT有几种方法

优点：简单，技术门栏低，目前ChatGPT3.5是免费的
缺点：需要开代理，国内无法直接使用

使用 ChatGPT API

优点：更安全，需要一定的技术能力和开发能力
缺点：ChatGPT API是需要付费

OpenRouter 快速获取 ChatGPT API Key

Sat, 13 Dec 2025 02:14:42 GMT

OpenRouter 快速获取 ChatGPT API Key

OpenRouter是一个开源的API代理服务，可以免费使用ChatGPT的API，支持自定义接口，模型等，关键你可以一个key同时调用多个模型

前提

Visa信用卡
谷歌账号
已经部署了ChatGPTNextWeb，或支持自定义接口

打开 https://openrouter.ai 使用 google 账号登录
点顶部的 Credits 绑定信用卡，这里我充值 10 美元，注意 openrouter 会额外收一定的手续费

进到 https://openrouter.ai/keys 页面，点 create key，起个名字

最好也填上 Credit Limit, 这里我填5，超过5美元后就会自动停用

最终我们拿到 sk 开头的key

进到已经部署了ChatGPTNextWeb的配置页面

接口地址: https://openrouter.ai/api
API Key: 填写 OpenRouter sk 开头的key

切换模型，验证是否生效

手把手教程

Sat, 13 Dec 2025 02:14:42 GMT

手把手教程

https://dev.amazoncloud.cn/experience/cloudlab?id=65fd7f888f852201f9704488

Titan Text G1 - Express 就是垃圾，根本不能用

bash

aws bedrock-runtime invoke-model \
--model-id meta.llama2-13b-chat-v1 \
--body "{\"prompt\":\"[INST]Find the issue in this code below. Explain your reason\\nimport torch\\ntorch.device(\\\"cuda:0\\\" if torch.cuda.is_available() else \\\"cpu\\\")\\ndef run_som_func(a, b):\\nc = c*2\\nc=a+b\\nprint(c)\\nreturn c ^ 2\\nI get an error saying variable referred before[/INST]\",\"max_gen_len\":512,\"temperature\":0.5,\"top_p\":0.9}" \
--cli-binary-format raw-in-base64-out \
--region us-east-1 \
invoke-model-output.txt

bash

curl 'https://dev-media.amazoncloud.cn/doc/workshop.zip' --output workshop.zip
unzip workshop.zip
pip3 install -r bedrock/workshop/setup/requirements.txt -U

# add code for labs/api/bedrock_api.py

python bedrock/workshop/labs/api/bedrock_api.py

streamlit run bedrock/workshop/labs/text/text_app.py --server.port 8080

streamlit run bedrock/workshop/labs/streaming/streaming_app.py --server.port 8080

LangChain

LangChain可以抽象出使用Boto3客户端的许多细节，尤其是当你想专注于文本输入和文本输出时。

Bedrock Access Gateway

把 OpenAI API 的调用转发到 Amazon Bedrock，从而获得包括 Claude3 在内的多种 LLM 的优秀能力

参考

https://docs.dify.ai/v/zh-hans/getting-started/readme/model-providers

AWS 切换用户

Sat, 13 Dec 2025 02:14:42 GMT

AWS 切换用户

AWS 要授权给他人访问指定资源有哪几种方式呢？

在自己帐号下创建一个用户，把 Access Key ID 和 Secret Access Key 告诉别人。可为该用户限定权限，但任何获得那两个 Key 的人都能使用该用户。不够安全。
创建一个 IAM Role, 并指定谁(帐号或 Role) 能以该 Role 的身份来访问。被 Assume 的 Role 可限定权限和会话有效期。

所以，用 Assume Role 的方式具有更高的安全可控性，还不用维护 Access Key ID 和 Secret Access Key。

比如在构建和部署时通常是有一个特定的 Account, 然后 Assume 到别的 IAM Role 去操作资源。

本文将详细介绍在帐号 A 创建一个 IAM Role(标注为 R) 并分配一些权限，然后允许另一个帐号 B 以 IAM Role - R 的身份来访问帐号 A 下的资源。

IAM Role 将用 awscli 来创建，Assume Role 的过程用 awscli 和 boto3 Python 代码两种方式来演示。

已知两个账号A，B

~/.aws/credentials 添加好key

ini

[a]
aws_access_key_id=AKIA5*****USBKPN4DIH
aws_secret_access_key=OdUsUew**********MEgoC8*****9LCvbqkaCQQS

[b]
aws_access_key_id=AKIA*****2USOGAHFVAU
aws_secret_access_key=b2nXQ**********7EuBO*****5ngKM3Msg2CLqma

帐号 A 下创建 IAM Role

aws s3 ls --profile a

# 或者用环境变量，这是更推荐的方式
export AWS_DEFAULT_PROFILE=a

# 查看账户A下的S3资源
aws s3 ls

# 在账号A下创建 test-assumed-role
aws iam create-role --role-name test-assumed-role --assume-role-policy-document file://role-trust-policy.json

# 给新建的 test-assumed-role 加上 S3 的只读权限
aws iam attach-role-policy --role-name test-assumed-role --policy-arn arn:aws:iam::aws:policy/AmazonS3ReadOnlyAccess

帐号 B Assume 帐号 A 的 role

export AWS_DEFAULT_PROFILE=b
# 924612875556是账户A的account id
# 这句话的意思是用，将账户B切换为账户A
aws sts assume-role --role-arn arn:aws:iam::924612875556:role/test-assumed-role --role-session-name awscli-session

返回内容:

{
    "Credentials": {
        "AccessKeyId": "ASIA*******O5OOFMMB",
        "SecretAccessKey": "qLR4rNZ*******PPJAIBx22plNN8oWIRtp2bbq",
        "SessionToken": "IQoJb3JpZ2luX2VjEPb//////////wEaDmFwLW5v*******xIkcwRQIgCKgl/h9gP4430qtSRfnp*******VddkekMUcN2ECIQC06q/7vYhcVMj7jujstIVzBhecnYQgB3bZf0l5qaxjzyqbAggwEAEaDDkyNDYxMjg3NTU1NiIMKP1BdAa6NQhoo2FYKvgBy5B1tyKn0GPz7DwG+YWxdfc9+ayNwzulKsF895wLpzuC9Hkyd2+KL22PgcaAOHV+PU3CPicDS8xTlanAQZvlPQy3egXv+JNOwlrJaVmyKuNbtzGCpYlBFs9TnC1sD+Uz0MGtXPh3GLhoZZ9gHt7fktDwohoz5+fbA+6zXUvO4xmFAicoYy7PCSM1v8weQ+oXqMAFREJ3Pd3Zs3y5adQYK100+reEJ1uvMIIdk3KSKYsF3T8ZByU+MdP+YBSgilfaY/YVgXExUp0B2dwWMRRh95FSdmmIfAtqSrt/0mXhah5zxTaoVxbPUT68A6Fj4Gecw+3iZiIeM2MwycSrlgY6nQGlo4fNrVvHEgw8yBFPE6wiY+jAi1vLNplxJ1WN59OMK+0rfdyBO91JFeoOEiQNXzbZJSorI2SuEUi3dVgVotvGwCMYsOYByM4zyJa9tdsjXTKX6UL2CdHyGKm6y5QK1DhXhl9mtEMqNqEWoQN4LkgGHv/4fzJLoFqKO2cC+VZDQ40AofaTVEsKaJjU3zt3NCUa+Ltq5qyfyTkHxoky",
        "Expiration": "2022-07-10T15:29:29+00:00"
    },
    "AssumedRoleUser": {
        "AssumedRoleId": "AROA5ORZY2USEASI2XI4F:awscli-session",
        "Arn": "arn:aws:sts::924612875556:assumed-role/test-assumed-role/awscli-session"
    }
}

这时候得到一组新的 AccessKeyId, SecretAccessKey 和 SessionToken，可以在 ~/.aws/credentials 中配置一个新的 profile C, 然后 export AWS_DEFAULT_PROFILE=C 来使用。或都用 export 分别导出三个环境变量 AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY, 和 AWS_SESSION_TOKEN, 分别对应前面的三个值。

$ export AWS_ACCESS_KEY_ID=<Credentials.AccessKeyId>
$ export AWS_SECRET_ACCESS_KEY=<Credentials.SecretAccessKey>
$ export AWS_SESSION_TOKEN=<Credentials.SessionToken>

aws s3 ls --profile c

# 想访问超出 test-assumed-role 之外的权限将被提示 Access Denied
aws s3 cp Desktop/jump-server.sh s3://blog.finleyma.ml --profile ty-assume
upload failed: Desktop/jump-server.sh to s3://blog.finleyma.ml/jump-server.sh An error occurred (AccessDenied) when calling the PutObject operation: Access Denied

# 查看当前所使用的角色
aws sts get-caller-identity --profile c

{
    "UserId": "AROA5ORZY2USEASI2XI4F:awscli-session",
    "Account": "924612875556",
    "Arn": "arn:aws:sts::924612875556:assumed-role/test-assumed-role/awscli-session"
}

用 Python 的 boto3 包实现

帐号 B 登陆，调用 boto3 的 sts.assume_role() 函数切换到帐号 A 下的 IAM Role test-assumed-role，之后的操作就限定到 test-assumed-role 的约束中了。

python

import boto3
 
aws_credentials_b = {
    'region_name': 'us-east-1',
    'aws_access_key_id':'PNKDIESJGWAURFEWDLLT',
    'aws_secret_access_key':'TdTMlDUSKecRadKeMlNIBEmIkRjmZOSvtnhgQDZc',
    'aws_session_token':'IQoJb3JpZ2luX2VjEDYabEbMG5J2lzlv......IEQisSAwzmnkv7LNf+'
}
 
 
sts=boto3.client('sts', **aws_credentials_b)
 
stsresponse = sts.assume_role(
    RoleArn="arn:aws:iam::123456789011:role/test-assumed-role", # under account A
    RoleSessionName='assumed'
)
 
aws_credentials_assumed_role = {
    'region_name':'us-east-1',
    'aws_access_key_id':stsresponse["Credentials"]["AccessKeyId"],
    'aws_secret_access_key':stsresponse["Credentials"]["SecretAccessKey"],
    'aws_session_token':stsresponse["Credentials"]["SessionToken"]
}
 
 
boto3.setup_default_session(**aws_credentials_assumed_role)
 
s3 = boto3.client('s3')
buckets_of_a = [bucket['Name'] for bucket in s3.list_buckets()['Buckets']]

当然，使用 Python 的话可以进一步封装，比如默认以帐号 B 登陆，然后执行一个函数 switch_role(role_arn) 后，后续的 boto3 client 就全部变成了 assumed role 的角色了

python

import boto3
 
def switch_role(assume_role_arn):
    sts=boto3.client('sts')
    sts_res = sts.assume_role(RoleArn=assume_role_arn, RoleSessionName='new_session')
 
    new_credentials = {'aws' + re.sub('([A-Z]+)', r'_\1', key).lower(): value
                       for (key, value) in sts_res["Credentials"].items() if key != 'Expiration'}
 
    boto3.setup_default_session(**new_credentials)
    
switch_role('arn:aws:iam::123456789011:role/test-assumed-role')
 
s3 = boto3.client('s3')
buckets_of_a = [bucket['Name'] for bucket in s3.list_buckets()['Buckets']]

把 sts_res['Credentials'] 转换为 session 要求的格式是简化，但是要注意以后 assume_role() 响应格式的变化有可能影响到程序的正常执行。

参考

https://docs.aws.amazon.com/zh_cn/IAM/latest/UserGuide/tutorial_cross-account-with-roles.html

https://yanbin.blog/how-to-assume-aws-iam-role/

https://blog.51cto.com/wzlinux/2462544

痛点

Sat, 13 Dec 2025 02:14:42 GMT

痛点

有时候我们在云上部署一套高可用的系统往往需要创建很多资源，以在AWS部署一个Web服务为例：

2台EC2
ALB(负载均衡)
RDS(弹性数据库)
Route53(域名解析)
CloudFront(CDN)
S3(管理静态资源)
IAM(用户管理)
SES(电子邮件服务)
CloudWatch(监控)

光这么多资源，如果在页面上手动创建配置即便是再熟练，也会很累。还有其他缺点：手动部署，容易出错无法进行版本化控制需要专人部署，人员无法复用

如果使用CloudFormation，我们可以把这些资源都放在一个模板里，然后通过CloudFormation控制台来创建或者更新这些资源。

什么是CloudFormation

所谓堆栈资源，表示一种依赖关系，比如要使用ALB资源，那么就需要实例资源。使用实例要先创建安全组。堆栈资源最终是一个资源集合。

CloudFormation模板

CloudFormation 模板是 JSON 或 YAML 格式的文本文件。以下面为例。表示创建一个EC2实例，指定了实例的AMI，类型，密钥对名称和数据卷。然后需要一个EIP来关联它。

yaml

AWSTemplateFormatVersion: "2010-09-09"
Description: A sample template
Resources:
  MyEC2Instance:
    Type: "AWS::EC2::Instance"
    Properties:
      ImageId: "ami-0ff8a91507f77f867"
      AvailabilityZone: "ap-northeast-1a"
      InstanceType: t2.micro
      KeyName: testkey
      BlockDeviceMappings:
        - DeviceName: /dev/sdm
          Ebs:
            VolumeType: io1
            Iops: 200
            DeleteOnTermination: false
            VolumeSize: 20
  MyEIP:
    Type: AWS::EC2::EIP
    Properties:
      # !Ref 等价 Fn::Ref
      InstanceId: !Ref MyEC2Instance

一个标准的模板由下面的部分组成，只有Resources是必需的

yaml

---
# 可选
AWSTemplateFormatVersion: "version date"

# 可选
Description:
  String

# 可选
# Designer 添加的信息，或者注释
# CloudFormation 不会转换、修改或编辑在 Metadata 区段中包含的任何信息
Metadata:
  template metadata

# 可选
Parameters:
  # set of parameters
  KeyName:
    Type: "AWS::EC2::KeyPair::KeyName"
    Description:
      "Name of an existing EC2 KeyPair to enable SSH access to the instances"
    Default:
      "my-awesome-key-name"
  SecurityGroupIDs:
    Type: "List<AWS::EC2::SecurityGroup::Id>"
    Description:
      "Name of an existing security group"
    Default:
      "sg-1a2b3cd4"
  EnvType:
    Type: "String"
    Description:
      "The type of environment"
    AllowableValues:
      - "test"
      - "prod"
      - "staging"
    Default:
      "test"  
# 可选
Rules:
  set of rules

# 可选
# 创建一个名为InstanceType的映射，在美东区我们使用m1.small，美西区使用m1.nano
Mappings:
  InstanceType:
    us-east-1:
      Type: "m1.small"
    us-west-1:
      Type: "m1.nano"
  SubnetMap:
    us-east-1:
      SubnetID: "subnet-12345678"
    us-west-1:
      SubnetID: "subnet-7654321"

# 可选
# 比如测试环境用安全组A，正式环境用B
Conditions:
  set of conditions

# 可选
Transform:
  set of transforms

# 必需
Resources:
  set of resources

# 可选
# 比如输出新创建的IP是什么
Outputs:
  # set of outputs
  KeyName
    Description: "This is the EIP for EC2"
    Value:
      Ref: MyEIP

AWS比较牛逼的是提供了AWS CloudFormation Designer可视化工具来拖拖拽拽资源生成模板。

并且官方提供了很多示例模板，你可以直接拿来改改就能用。

实战

如果已经有模板，可以直接上传到S3，然后填S3地址读取

参考

https://github.com/awslabs/aws-cloudformation-templates

https://docs.aws.amazon.com/zh_cn/AWSCloudFormation/latest/UserGuide/cfn-whatis-concepts.html

https://github.com/cloudtools/troposphere

如何修改Userdata

Sat, 13 Dec 2025 02:14:42 GMT

我们在初始一个 AWS EC2 实例时，可以通过 user data 让 EC2 第一次启动后做些事情，可以放置 shell script 或 cloud-init 指令。在控制台设置 user data 可用明文文本，由 awscli 创建时可使用一个文件，或者通过 API 用 base64 编码的内容。

下面是 user data 被执行时需知晓的一些知识

是脚本时必须以 #! 开始，俗称 Shebang, 如 #!/bin/bash
user data 是以 root 身份执行，所以不要用 sudo, 当然创建的目录或文件的 owner 也是 root，需要 ec2-user 用* 户访问的话需要 chmod 修改文件权限，或者直接用 chown ec2-user:ec2-user -R abc 修改文件的所有者()
脚本不能交互，有交互时必须想办法跳过用户输入，如 apt install -y xzy, 带个 -y 标记
如果脚本中需访问 AWS 资源，权限由 Instance Profile 所指定的 IAM role 决定
user data 中的脚本会被存储在 /var/lib/cloud/instances//user-data.txt 文件中，因此也* 可以从这里验证 user data 是否设置正确。或者在 EC2 实例上访问 http://169.254.169.254/latest/* user-data 也能看到 user data 的内容。并且在 EC2 实例初始化后不被删除，所以以此实例为基础来创建一个新的 * AMI 需把它删除了
user data 的大小限制为 16 KB, 指 base64 编码前的大小
cloud-init 的输出日志在 /var/log/cloud-init-output.log, 它会捕获 cloud-init 控制台的输出内容

user data 的内容通常在创建好实例后，还得等一会才完全生效，马上用 SSH 登陆新创建后的实例一般还看不到效果，有可能得等分把钟。

脚本的内容会存储在 EC2 实例上，但它执行的控制台输出却没地方找，如果脚本执行过程中有问题就难以诊断了，这里有个办法可记录下 user data 中脚本执行的控制台输出，需在 user data 中加上一行，最后把调试也打开

bash

#!/bin/bash -ex
exec > >(tee /var/log/user-data.log|logger -t user-data -s 2>/dev/console) 2>&1
apt update
......

对，你没有看错，上面的 exec > >(... 两个大括号之间有空格

这样就能在实例的 /var/log/user-data.log 中看到所有 user data 中脚本执行的控制台输出了，错在哪一步也就能有的放矢的修正。

如何修改Userdata

首先把实例停止
在实例仍被选中的情况下，依次选择操作、实例设置和编辑用户数据。
启动实例

参考

https://aws.amazon.com/cn/premiumsupport/knowledge-center/execute-user-data-ec2/

https://docs.amazonaws.cn/AWSEC2/latest/UserGuide/user-data.html#user-data-view-change

IAM role creation

Sat, 13 Dec 2025 02:14:42 GMT

IAM role creation

IAM > roles > create role
custom trust policy > copy + paste

json

{
  "Version": "2012-10-17",
  "Statement": [{
    "Effect": "Allow",
    "Principal": {
      "Service": "ecs-tasks.amazonaws.com"},
      "Action": "sts:AssumeRole"
  }]
}

Add permission > Create Policy
JSON > replace YOUR_REGION_HERE & YOUR_ACCOUNT_ID_HERE & CLUSTER_NAME > copy + paste

json

{
  "Version": "2012-10-17",
  "Statement": [{
    "Effect": "Allow",
    "Action": [
      "ssmmessages:CreateControlChannel",
      "ssmmessages:CreateDataChannel",
      "ssmmessages:OpenControlChannel",
      "ssmmessages:OpenDataChannel"
    ],
    "Resource": "*"
  },
    {
      "Effect": "Allow",
      "Action": [
        "logs:DescribeLogGroups"
      ],
      "Resource": "*"
    },
    {
      "Effect": "Allow",
      "Action": [
        "logs:CreateLogStream",
        "logs:DescribeLogStreams",
        "logs:PutLogEvents"
      ],
      "Resource": "arn:aws:logs:YOUR_REGION_HERE:YOUR_ACCOUNT_ID_HERE:log-group:/aws/ecs/CLUSTER_NAME:*"
    }
  ]
}

Give it a name
go back to Add permissions > search by name > check > Next
Give a role name > create role

ECS new task

go back to ECS > go to task definition and create a new revision
select your new role for "Task role" (different than "Task execution role") > update Task definition
go to your service > update > ensure revision is set to latest > finish update of the service
current task and it should auto provision your new task with its new role.
try again

Commands I used to exec in

Option1

enables execute command

CLUSTER_NAME=node-red
REGION=cn-north-1
SERVICE_NAME=service-nodered
CONTAINER=nodered

aws ecs update-service --cluster $CLUSTER_NAME --service $SERVICE_NAME --region $REGION --enable-execute-command --force-new-deployment

adds ARN to environment for easier cli. Does assume only 1 task running for the service, otherwise just manually go to ECS and grab arn and set them for your cli

TASK_ARN=$(aws ecs list-tasks --cluster CLUSTER_NAME --service SERVICE_NAME --region REGION --output text --query 'taskArns[0]')

TASK_ARN=arn:aws-cn:ecs:cn-north-1:777702137755:task/node-red/417a6af0a8c447f9a57d8e49ba7cc84c

adds ARN to environment for easier cli. Does assume only 1 task running for the service, otherwise just manually go to ECS and grab arn and set them for your cli

aws ecs describe-tasks --cluster CLUSTER_NAME --region REGION --tasks $TASK_ARN

exec in aws ecs execute-command --region $REGION --cluster $CLUSTER_NAME --task $TASK_ARN --container $CONTAINER --command "sh" --interactive

Option2

if you are using Jetbrains IDE, install plugin https://docs.aws.amazon.com/toolkit-for-jetbrains/latest/userguide/welcome.html

this plugin will help you to enables execute command and exec in

参考

https://docs.aws.amazon.com/AmazonECS/latest/developerguide/ecs-exec.html

https://github.com/aws/aws-cli/issues/6242#issuecomment-1079214960

https://issuecloser.com/blog/debugging-node-js-applications-running-on-ecs-fargate

https://zhuanlan.zhihu.com/p/367127434

assuming role

Sat, 13 Dec 2025 02:14:42 GMT

json

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "MyListBucket",
      "Effect": "Allow",
      "Action": "S3:ListBucket",
      "Resource": [
        "arn:aws:s3:::com.demo.file"
      ],
      "Condition": {"StringEquals":  {"aws:username": "Bob"}}
    }
  ]
}

同一Condition名称不能出现两次，要合并

https://docs.aws.amazon.com/zh_cn/IAM/latest/UserGuide/reference_policies_elements_condition_operators.html

IAM User 可以属于某个 IAM Group，甚至可以属于多个 Group
IAM User 无法属于某个 IAM Role，必须透过”切换”的方式，在 AWS 中称为 “Assume Role”，而”切换”这个操作需要有权限才行

Assume Role 基本上是一种 Action("Action": "sts:AssumeRole")，因为 Assume Role 这个行为是从 AWS Security Token Service 中取得一个暂时的 token，藉此取得该 Role 所事先定义好的权限。(sts:AssumeRole Action & IAM Role 的对应关係可以从[此 AWS 官网文件]（https://docs.aws.amazon.com/zh_cn/service-authorization/latest/reference/list_awssecuritytokenservice.html#awssecuritytokenservice-actions-as-permissions）找到)

assuming role

切换角色

参考

https://godleon.github.io/blog/AWS/learn-AWS-IAM-2-policy/

Serverless 的重点

Sat, 13 Dec 2025 02:14:42 GMT

Serverless 的重点

不需要部署 or 管理 server
会根据需求自动的 scale out/in
不需要为 idle 资源支付费用
天生就具备的 HA & fault tolerance 等特性

目前 AWS 提供的 serverless service 其实很多，下图是目前比较常见的几个：

但要如何判断 AWS service 是否为 serverless? 只要评估一下上一个 section 提到的四个原则，如果都满足，表示这个服务属于 serverless(例如：Lambda、SNS、SQS)，只要有一项不满足，则该服务不属于 serverless(例如：EC2、Kinesis)

Lambda

文件中提到可设定 Lambda Function 执行时使用的 memory 范围在 128MB ~ 10,240MB(10GB) 之间

比较需要注意的是，Lambda function 执行时的vCPU core 的数量是根据 memory 的设定大小来决定，如果在设定最大 10GB memory 的情况下，可以取得最大 6 vCPU core；简单来说，就是 memory 设定越大，执行速度会越快，当然费用也会越高

实际上就是只有 memory & timeout 设定可以调整而已

地域 Region

Sat, 13 Dec 2025 02:14:42 GMT

亚马逊 AWS(Amazon Web Service) 占据全球四成公有云市场份额(2021年统计)，排名第一

包含的产品多余牛毛

很多国外用户都在使用AWS的产品，著名的有S3，EC2，所有有必要了解一下。

这里介绍最基础的产品，VPC(Virtual Private Cloud)，虚拟私有云。

先看下一些基础概念

地域 Region

AWS 在世界各地有很多数据中心，一个 Region 就是多个数据中心的集群

目前在中国大陆地区有北京和宁夏两个 Region

可用区 AZ（Availability Zone）

每个 Region 中包含数个独立的，物理分隔开的 AZ（Availability Zone），每个 AZ 有独立的供电，制冷，安保。

同一 Region 内 AZ 之间由高带宽，极低延时的光纤网络相连，数据以加密形式传输。

ap-northeast-1 是 region 名称

ap-northeast-1a,ap-northeast-1c,ap-northeast-1d 是 AZ

你可以理解为北京Region cn-north-1，朝阳区有个AZ:cn-north-1c，海淀区有个AZ:cn-north-1d 同一Region下的AZ之间由高速网络连接，重要的数据可以放到多AZ里，假如朝阳区机房停电或失火，通过配置流量和数据可以使用海淀区的。这就是简单的容灾备份。

虚拟私有网络 VPC

VPC（Amazon Virtual Private Cloud）是用户在 Region 中自定义的虚拟网络，是一个整体概念。

用户可以在一个 Region 中创建多个 VPC。

我们可以在 VPC 中选择 IP 网段，创建 Subnet，指定 Route Table，控制 ACL（Access Control list），设置网关等。

多业务系统隔离

如果在一个地域的多个业务系统需要通过VPC进行严格隔离，例如，生产环境和测试环境，那么也需要使用多个VPC。

同样可以通过使用高速通道、VPN网关、云企业网等产品实现同地域VPC间互通。

多地域部署系统

VPC是地域级别的资源，不支持跨地域部署。当有多地域部署系统的需求时，必须使用多个VPC。可以通过使用高速通道、VPN网关、云企业网等产品实现跨地域VPC间互通。

当 VPC 创建完成后主路由表和 Main network ACL 会自动创建。

用户可以在公有云上创建一个或者多个VPC，比如，一个大公司里每个部门分配一个VPC。对于需要连通的部门创建VPC连接。

IP段用CIDR表示

CIDR

无类别域间路由（Classless Inter-Domain Routing、CIDR）是一个用于给用户分配IP地址以及在互联网上有效地路由IP数据包的对IP地址进行归类的方法。

遵从CIDR规则的地址有一个后缀说明前缀的位数，例如：192.168.0.0/16。这使得对日益缺乏的IPv4地址的使用更加有效。

也就是说，创建子网时要考虑你需要的资源数

IP/CIDR	掩码	主机数
a.b.c.d/32	255.255.255.255	1
a.b.c.0/28	255.255.255.240	16
a.b.c.0/24	255.255.255.000	256
a.b.0.0/16	255.255.000.000	65,536

Subnet

子网是 VPC 中的 IP 地址范围。在创建 VPC 之后，可以在每个可用区中添加一个或多个子网。

我们一般创建两种子网 Private Subnet 和 Public Subnet。

简单来说，不能直接访问 internet 互联网的 Subnet 就是 Private Subnet，能直接访问 internet 的就是 Public Subnet。

当然 Private Subnet 也可以通过 NAT 的方式访问 internet

当我们在一个 VPC 中创建 Subnet 时需要给 Subnet 选择一个 AZ（Availability Zone），一个 Subnet 只能选择建在一个 AZ 中。

实战

实现图上的功能，创建两个子网

一个是 Public Subnet，可以访问因特网，另一个是 Private Subnet
一个是 Private Subnet，不能访问因特网

创建VPC

IPv4 CIDR: 192.168.0.0/16

创建互联网网关

并attach到finley-vpc上

创建三个子网

分别为 public, private, public&private（私网通过NAT访问公网）

| subnet id | IPV4 CIDR | AZ | 用途 | :-----| :---- | :---- | | finley-public | 192.168.0.0/24 | ap-northeast-1a | 部署web服务器 | finley-private| 192.168.2.0/24 | ap-northeast-1d | 部署数据库 | finley-private&public | 192.168.1.0/24| ap-northeast-1c| 部署应用程序

创建两个路由表

路由表包含一组称为路由的规则，用于确定来自子网或网关的网络流量定向到何处。

路由表必须属于某VPC

一个公有子网，一个私有子网但可通过NAT访问公网

编辑路由表

# 第一条表示到192.168.*.*的请求会发送至VPC中
192.168.0.0/16	local

# 第二条表示到其它IP的请求会发送至IGW
0.0.0.0/0	igw-0d1092780f692f46f

编辑子网关联

创建第二个路由

编辑子网关联，选择finley-private&public

创建EC2

创建两个EC2，一个名为finley-public-ec2，一个finley-private-ec2

VPC选择finley-vpc

申请弹性IP，得到公网IP：52.197.152.165 并关联给 finley-public-ec2

实例名	公有 IPv4 地址	私有 IPv4 地址
finley-public-ec2	52.197.152.165	192.168.0.107
finley-private-ec2	无	192.168.2.197

EIP（Elastic IP）是AWS提供的静态公共IP，可以从internet上访问到。实例即便被删除IP也会保留

SSH ssh -i "aws-ty-2022.pem" [email protected] 登录实例

aws-ty-2022.pem 私钥是之前申请过的

检查网络配置，安装nginx或httpd，浏览器打开52.197.152.165，访问成功

bash

ubuntu@ip-192-168-0-93:~$ ifconfig
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 9001
        inet 192.168.0.93  netmask 255.255.255.0  broadcast 192.168.0.255
        inet6 fe80::4c3:76ff:feef:971  prefixlen 64  scopeid 0x20<link>
        ether 06:c3:76:ef:09:71  txqueuelen 1000  (Ethernet)
        RX packets 2795  bytes 2887062 (2.8 MB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 1519  bytes 178671 (178.6 KB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions

finley-private-ec2 只有一个私网地址，由于我们选择private子网

会得到一个私网地址，如192.168.2.197，即使有公网IP，也无法通过互联网访问

可以通过finley-public-ec2登录这个私有子网的实例

# 在本机执行
## 上传私钥到public ec2
scp ~/.ssh/aws.pem 52.197.152.165:~
## 登录public ec2
ssh -i ~/.ssh/aws.pem 52.197.152.165
# 在 public ec2 上执行
chmod 400 aws.pem
## 登录private-ec2
ssh -i ~/.ssh/aws.pem 192.168.2.197
# 进到私网实例，确实无法访问互联网
wget www.baidu.com

通过NAT网关使私有子网访问互联网

注意NAT是按小时收费的，用完及时释放

NAT 网关是一种网络地址转换 (NAT) 服务。可以使用 NAT 网关，以便私有子网中的实例可以连接到 VPC 外部的服务，但外部服务无法启动与这些实例的连接。

路由器将互联网流量从私有子网中的实例发送到 NAT 网关。NAT 网关通过使用自身的弹性 IP 地址作为源 IP 地址，将流量发送到互联网网关。

创建 NAT网关

NAT网关要创建在公有子网当中，选择一个公有子网，创建成功后等待状态变为可用

参考：计算机网络

修改路由表，等状态变为available

目的地	目标
192.168.0.0/16	本地
0.0.0.0/02	nat-gateway-id

此时finley-private-ec2可以访问互联网了，是通过NAT关联的IP

通过终端节点让私有网络访问aws服务(S3)

VPC 终端节点使您能够在 Virtual Private Cloud (VPC) 与支持的服务和之间建立连接，而无需使用互联网网关、NAT 设备、VPN 连接或 AWS Direct Connect 连接。

因此，VPC 不会对公有 Internet 公开。

实现私有地址访问公有服务，这里我们让私有子网中的实例访问S3服务，首先创建终端节点

实际上是添加了一条路由表信息

访问S3并下载文件成功

VPC peering 对等连接

VPC 对等连接是两个 VPC 之间的网络连接

可以在自己的 VPC 之间创建 VPC 对等连接，或者在自己的 VPC 与其他AWS账户中的 VPC 之间创建连接

VPC 可位于不同区域内（也称为区域间 VPC 对等连接）。

例如，如果您有多个AWS账户，则可以通过在这些账户中的 VPC 间建立对等连接来创建文件共享网络。

您还可以使用 VPC 对等连接来允许其他 VPC 访问您某个 VPC 中的资源。

总结

首先我们选择Region，随后所有创建的内容都是存在此Region中
创建VPC，一个虚拟网络，在里面设置IP段，VPC是一个逻辑结构，并不和AZ（Availability Zone）直接相关
在VPC中创建Subnet，需指定IP段，并且指定所在的AZ，一个Subnet只能指定一个AZ，一个AZ可以容纳多个Subnet
VPC中Subnet默认是可以相互访问的
新建的Subnet默认就是Private Subnet
IGW(Internet gate way)是一个独立的组件配置在VPC上，使得VPC可以访问internet
在Private Subnet中配置了到IGW的路由后，就变成Public Subnet
Public Subnet中的EC2还要再配置一个Public IP或者EIP就可以访问Internet
如果EC2可以访问internet，其关联的Security Group入站规则如果允许从internet访问，那么这个EC2就可以从internet中直接访问到
实践中我们把应用程序，数据库放在Private Subnet中，阻止从internet访问。把堡垒机和ALB（Application Load balancer）放在Public Subnet，允许从internet访问
配置了NAT路由的Private Subnet中EC2可以访问internet，但不能被internet访问到,因为这个EC2并没有IP，流量是通过NAT转换了，NAT有IP
NAT gateway需要一个EIP（Elastic IP）并且把NAT配置在Public Subnet中
有时候Private Subnet中的EC2虽然不能访问外部internet，也需要访问特定服务如S3，RDS，这时候可以创建End Point
创建End Point需要选择Service种类，VPC,路由表，实际上会在选择的路由表上添加一条记录，前缀是vpce-
每个Subnet都必须关联一个路由表，创建的每个Subnet都会自动关联 VPC 的主路由表
创建Security Group时，只需指定VPC。之后可以把SG与EC2， RDS, VPC Endpoint相关连，用来控制这些服务的出入站IP和端口
所有 IPv4 流量 (0.0.0.0/0)，IPv6 流量 (::/0)

参考

https://aws.amazon.com/cn/vpc/faqs/

https://help.aliyun.com/document_detail/54095.html

https://docs.aws.amazon.com/zh_cn/vpc/latest/userguide/VPC_Subnets.html

https://www.bilibili.com/video/BV1wk4y1r7gX

https://www.iloveaws.cn/3707.html

https://zh.wikipedia.org/zh-hans/无类别域间路由

创建EC2

Sat, 13 Dec 2025 02:14:42 GMT

创建EC2

yaml

# https://docs.aws.amazon.com/zh_cn/zh_cn/AWSCloudFormation/latest/UserGuide/intrinsic-function-reference-rules.html

# 防止用户选择错误内容参数

# 每个模板规则由两个属性组成：

# 规则条件（可选）— 确定规则的生效时间。

# 断言（必选）— 描述用户可为特定参数指定的值。

AWSTemplateFormatVersion: "2010-09-09"

Resources:
  MyInstance:
    Type: AWS::EC2::Instance
    Properties:
      InstanceType: 't2.micro'
      AvailabilityZone: 'ap-northeast-1a'
      KeyName: 'aws-ty-2022'
      ImageId: ami-03d79d440297083e3
      UserData:
        # 内部函数 Fn::Sub 将输入字符串中的变量替换为您指定的值
        Fn::Base64: |
          #!/bin/bash
          yum update -y

          timedatectl set-timezone "Asia/Shanghai"
          
          curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "/tmp/awscliv2.zip"
          unzip /tmp/awscliv2.zip -d /tmp/awslicv2
          /tmp/awslicv2/aws/install

          curl -sL https://rpm.nodesource.com/setup_14.x | bash -
          yum install -y gcc-c++ make 
          yum install -y nodejs
          
      Tags:
        - Key: Name
          # Jack---Jones
          Value: !Join ['-', ['Jack', '-', 'Jones']]

安装 kinesis agent

yum install -y aws-kinesis-agent

https://docs.aws.amazon.com/zh_cn/firehose/latest/dev/writing-with-agents.html

配置firehose

bash

# 配置凭证
cat /etc/sysconfig/aws-kinesis-agent

# AWS_ACCESS_KEY_ID=
# AWS_SECRET_ACCESS_KEY=
# AWS_DEFAULT_REGION=

cd /etc/aws-kinesis/
cat agent.json

{
  "cloudwatch.emitMetrics": true,
  "kinesis.endpoint": "",
  "firehose.endpoint": "",

  "flows": [
    {
      "filePattern": "/tmp/app.log*",
      "kinesisStream": "yourkinesisstream",
      "partitionKeyOption": "RANDOM"
    },
    {
      "filePattern": "/var/log/kinesis-log*",
      "deliveryStream": "yourdeliverystream"
    }
  ]
}


# 修改为：

{
  "cloudwatch.emitMetrics": true,
  "kinesis.endpoint": "",
  "firehose.endpoint": "firehose.cn-north-1.amazonaws.com.cn",

  "flows": [
    {
      "filePattern": "/var/log/kinesis-log/*.log",
      # Delivery stream 的名称
      "kinesisStream": "KDS-S3-LogGenerator"
    }
  ]
}

重启服务并查看日志

service aws-kinesis-agent restart
tail -f /var/log/aws-kinesis-agent/aws-kinesis-agent.log

生成日志

mkdir -p /var/log/kinesis-log

参考

https://aws.amazon.com/cn/kinesis/data-firehose/faqs/?nc=sn&loc=5

生成日志程序

const LOG_LINE_COUNT = 5
// 名称，分类，年龄，语言，平台，是否免费
const gameList = [
  ["马里奥","动作","全年龄","日语", "Switch", 0]
  ["GTA5","暴力","18","英语", "Steam", 0]
  ["FIFA22","体育","9","英语", "Steam", 0]
  ["FIFA22","体育","9","英语", "Steam", 0]
]

function sleep(ms) {
  return new Promise(resolve => {
    setTimeout(resolve, ms)
  })
}

function *myGenerator() {
  let index = 1;
  while(true) {
    yield index++;
  }
}

const logGenerator = async() => {
  
}


logGenerator()

bash

2022-05-29 22:10:51.123, "马里奥","动作","全年龄","日语", "Switch", 0
2022-05-29 22:10:51.243, "GTA5","暴力","18","英语", "Steam", 0
2022-05-29 22:10:51.312, "FIFA22","体育","9","英语", "Steam", 0
2022-05-29 22:10:51.567, "FIFA22","体育","9","英语", "Steam",
2022-05-29 22:10:51.123, "马里奥","动作","全年龄","日语", "Switch", 0
2022-05-29 22:10:51.243, "GTA5","暴力","18","英语", "Steam", 0
2022-05-29 22:10:51.312, "FIFA22","体育","9","英语", "Steam", 00

logdate timestamp,
name string,
category string,
age string,
lang string,
platform string,
isfree tinyint

sql

CREATE EXTERNAL TABLE IF NOT EXISTS `my_db`.`log-game` (
  `logdate` timestamp,
  `name` string,
  `category` string,
  `age` string,
  `lang` string,
  `platform` string,
  `isfree` tinyint
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
WITH SERDEPROPERTIES (
  'serialization.format' = ',',
  'field.delim' = ','
) LOCATION 's3://finley-athena-logs/'
TBLPROPERTIES ('has_encrypted_data'='false');

注意引号

Sat, 13 Dec 2025 02:14:42 GMT

注册AWS账户，略，需要信用卡
底部切换语言为中文简体，右上角选择切换地区为亚太的一个，这里我选择的新加坡

进到管理控制台，选择启动虚拟机

选择ES2，创建一台服务器实例

注意勾选“仅免费套餐”，这里选择的是比较新的Ubuntu Server 18.04

配置选1核1G就行，直接点击“审核和启动”
没有密钥对的话，先生成一个，会下载一个pem格式的文件，保存好，待会儿登录服务器要用到
如果是Windows系统，下载 MobaXterm 软件，根据提示连接主机

或者配置ssh config

Host aws-seoul
    HostName ec2-170-82-55.ap-northeast-2.compute.amazonaws.com
    User ubuntu
    Port 22
    IdentityFile ~/.ssh/aws-seoul.pem

登录成功

依次执行下面的命令，会让你设置密码，端口和加密方式(默认)

sudo wget --no-check-certificate https://raw.githubusercontent.com/teddysun/shadowsocks_install/master/shadowsocks-go.sh
sudo chmod +x shadowsocks-go.sh
sudo ./shadowsocks-go.sh 2>&1 | tee shadowsocks-go.log

安装成功后记录好信息打开酸酸乳客户端，填入信息

连接成功！
如果无法连接，在AWS后台添加安全组，编辑入站规则，端口填写刚SSR设置的端口在EC2控制面板，进入到了实例的安全组设置中。在左下部点击 “入站” 标签页，并点击编辑。点击 “添加规则”，添加的规则中“类型”“协议” 都不需要改动。“端口范围”这里填上我们前面设置的端口，“来源”下拉框中选择“任何位置”。
接下来还需要给服务器申请一个固定IP。点击弹性IP -> 分配新地址 -> 操作 -> 关联地址。选择自己的实例并关联。

参考：https://www.cnblogs.com/MingyaoZheng-blog/p/9786306.html

Sat, 13 Dec 2025 02:14:42 GMT

AWS的安全组比较强大，源或目标可以填IP地址，前缀列表，甚至是其他安全组的ID 如果是其他安全组的ID

例如，当前安全组、来自同一 VPC 的安全组或对等 VPC 的安全组。这允许基于与指定安全组关联的资源的私有 IP 地址的流量。这并不会将指定安全组的规则添加到当前安全组。

图形化工具：

Sat, 13 Dec 2025 02:14:42 GMT

持续部署中需要将编译后的静态资源打包上传到S3服务中，就研究了下。需要申请Amazon账号，得开通信用卡，可免费使用一年然后开通S3服务，填写bucket名字，最后生成Access Key和Access Secret。

图形化工具：

Windows平台： http://s3browser.com/

连接 bucket

mac平台

推荐Transmit

命令行工具(awscli)：

Windows平台：

https://s3.amazonaws.com/aws-cli/AWSCLI64.msi

Mac平台：

参考： https://github.com/aws/aws-cli

sudo easy_install pip
sudo pip install awscli --ignore-installed six
# 根据提示输入 Origin, AccessKey, AccessSecret
aws configure

AWS Cli 操作文档：https://docs.aws.amazon.com/cli/latest/reference/s3/cp.html

开放访问权限

默认情况下文件对象和上传的文件不能公共下载的，比如访问 https://s3-us-west-1.amazonaws.com/yourbucketname/README.md 会提示 access deny。如果需要对某目录下的文件开发公共访问权限，可以这么干，打开策略生成器

点击 generate policy,复制 json配置内容，粘贴到存储桶策略中

学习资源

Sat, 13 Dec 2025 02:14:42 GMT

学习资源

https://www.youtube.com/playlist?list=PLEiEAq2VkUULlNtIFhEQHo8gacvme35rz

https://www.bilibili.com/video/BV1vW411G75e

有用文档

Sat, 13 Dec 2025 02:14:42 GMT

外部镜像功能主要用于辅助完成数据迁移。对于设置了外部镜像源站的 Bucket，当请求的对象在 Bucket 中不存在时，系统自动从源站获取（回源），并写入到 Bucket 当中。在回源过程中，请求这个对象的客户端有可能会下载到源站文件，也有可能收到重定向到源站相应路径的 302 请求。在回源完成后，客户端能够直接从 Bucket 中获取这个对象。

假设镜像源站点为：https://example.com/static，请求的对象 key 为：images/logo.png，那么回源地址为：https://example.com/static/images/logo.png。

搜索 [https://hexo-blog.pek3b.qingstor.com] 替换为 [https://hexo-blog.pek3b.qingstor.com]

https://pek3b.qingstor.com/hexo-blog/upload_images/71414-ee2cca876c285107.png?imageMogr2/auto-orient/strip|imageView2/2/w/1240

替换为

https://pek3b.qingstor.com/hexo-blog/20200720101157e0cb75757.jpg

股票

Sat, 13 Dec 2025 02:14:42 GMT

股票

股票名词

可转债

新人必读，说清可转债及买卖操作

工具及网站

Sat, 13 Dec 2025 02:14:42 GMT

在节假日的前后去关注一下一个叫做「逆回购」的投资品种，它很适合你用来打理你股票账户里的闲散现金。

之所以敢跟你聊它，是因为它几乎零风险，手续费低，收益率又比余额宝高，在一些特殊的时间点上还可能有很高的年化收益率，是我们普通人类的好朋友。

逆回购是个什么东西呢？它的全称是「债券质押式逆回购」。

简单来说，就是你在证券账户里借给别人一笔超短期贷款。谁把你的钱借走了你是不知道的，但他会用他所持有的合格债券来作为抵押。

在借款时间到期后，他会把本金和利息一起还给你，打回你账上。

在A股市场上，逆回购产品是可以像普通股票一样交易的。你需要的就是开有股票账户，以及账户里至少有1000.10元。

其中1000元是逆回购的最小参与金额，1毛钱是参与这笔逆回购的手续费。

一笔逆回购的收益是这么计算的：收益=交易金额*收益率*计息天数/365-手续费。手续费很低，最低是万分之零点一，最高也就是万分之三。

上交所有9个逆回购品种，分别是1天、2天、3天、4天、7天、14天、28天、91天、182天的逆回购，每一个都有自己独立的交易代码；深交所有11个品种，比上交所多了63天和273天的2个品种。它们的名称和交易代码我放在文稿里，你可以备用。

你借出去的钱什么时候能回来呢？逆回购资金的到账日是T+N+0，提现日是T+N+1。N就是逆回购天数。

你逆回购1天，那么当天卖出，下一个交易日的开盘前，资金回到你的账户里，你可以进行股票交易，但是不能提现，要再过一天才能提现转出到自己的银行卡上。

上交所和深交所的逆回购产品参与门槛还不太一样，上交所的资金起点是10万，深交所是1000块，上交所产品的参与门槛高，参与人数也就比深交所要少。

所以同样期限的产品，上交所的利率有时会更高一些。比方说，同样在我写稿子这一天，11月23日，上交所的1天期逆回购产品GC001的收盘价格是2.595元，这就是年华收益率2.595%的意思；深交所的1天期逆回购产品R-001的收盘价格是1.99，年华收益率1.99%。怎么说呢，丰俭由人吧。

如果你账户里有笔1万块的闲钱想要借出去一天，你可以在交易日的15点半之前，在你的股票交易软件上输入131810，这就是R-001的交易代码，然后选择「卖出」10手，1000块一手，这笔钱就算借出去了。如果明天也是交易日的话，明天你就不用另外再进行反向操作了，在股市开盘之前，这笔钱就会连本带息回到你的账户上，不影响你明天买股票。

同样道理，你也可以卖出其他不同出借天数的逆回购产品。

你可能注意到刚才我说了一个奇怪的词，「卖出」。我们什么都没有，为什么不是买入这个逆回购品种呢？

话说到这儿，我为了给你解释为什么是「卖出」，捎带也要向你解释一下「逆回购」这个别扭的词。借钱就说借钱，为什么要用「逆回购」这个别扭的词呢？回购个什么？我来试着粗暴地解释一下：

在金融领域，「回购」这个词其实大家是跟着中央银行用的。央行发行的最基础产品是现金。所以，当央行想要收紧流动性，从商业银行收回现金这种产品的时候，这个操作就叫「正回购」，也就是相当于央行作为出品方要把现金这种产品买回来。那「逆回购」呢？就是把更多的现金产品投放到市场上。

所以我们只要记住，回购这个词的对象是「现金」。正回购就是回购现金，逆回购就是卖出现金，就可以了。

那正回购、逆回购里，央行和商业银行买卖现金这种产品的时候，双方用什么付账呢？暂时不付账，先欠着，但需要一个抵押品，这个抵押品通常是国债或者其他的合格债券。

拿一笔7天期限的逆回购来说，比如央行放出100亿现金给商业银行，银行你就要给我抵押品，这个抵押品通常就是国债。

7天后到期了，商业银行要把从我这儿拿走的100亿现金还回来，同时再加一笔利息。央行再把你押在我这儿的国债解除抵押，咱们就两清了。

这是央行的玩法。而我们普通人类虽然没有那么大的资金量，在股票交易平台上也是可以小规模体会一下当央行的感觉的，我们在放贷的时候，相当于也是在把现金卖给借款人，也是在给市场释放流动性。

一般来说，一笔逆回购交易，涉及三方参与者：

第一个是逆回购方，就是我们这样，手里有闲置现金，想要让它增值的人；

第二个是正回购方，也就是借款人，他手里有债券，现在着急用现金，想抵押债券来借钱。

多说一句，想做正回购的准入门槛是很高的，个人的话名下金融资产不能低于300万。还需要跟证券公司签特别的委托协议，今天我们就先不谈了。

第三个参与者，是监管和中介平台，在A股市场上就是上海证券交易所和深圳证券交易所。借款人的债券就抵押在交易所对应的电子平台上。

这个作为抵押品的债券，通常是国债或者企业的信用债，这些债券根据自己不同的信用等级，会折算成交易所承认的「标准券」。

有了这个抵押品，逆回购就几乎没有风险了。哪怕借款人真还不出钱，你的本息也是国家清算机构先垫付给你，然后它再去找借款人算账的。

那我为什么要选在新年前后提醒你特别注意这个品种呢？这是因为，在月底、年末、长假前后这种特殊时点上，市场的资金容易相对紧张，逆回购的年化收益率就会明显走高。

拿今年来说，10月9日也就是国庆节长假刚过，R-001的年化利率一开盘就冲到了6.2%，这背后一定是有借款人很急很缺钱，所以把利率开到了非常高。

我往回翻了翻数据，发现R-001在2016年2月27日的时候，年化收益率到过40%。

那什么时间的收益率会比较高呢？前面说了，在一年里，月末、年末、长假前后，因为这些时间点是银行要面对准备金率考核、或者企业要短期拆借的时候，市场上钱荒，所以每到这个时候，你就可以瞄一眼逆回购产品们。

如果你已经拿定主意在具体某一天里操作逆回购呢，那你也要注意了，一般上午的时间收益率会比下午高，因为急缺钱的借款人上午就把钱借走了。所以啊，具体到今年年底，要是12月31日是最后一个交易日，我建议你30号就开始留意一下逆回购的利率价格，如果合适的话就可以出手了。拿2019年的12月30日来说，深交所的1天逆回购产品R-001的最高年化收益率到了3.52%。

但你倒也不至于把茅台股票给卖了去操作逆回购，这个不值当的，把闲钱放进去就可以了。对我们普通人类来说，逆回购保本保收益，收益通常来说比余额宝高一点。

另外，长期投资也没必要考虑逆回购，用它来做1到7天的短期现金管理就可以了。逆回购的特殊吸引力主要是来自特殊时间点的收益率飙高，但在普通岁月里，逆回购的年化利率也就是2%到3%之间，吸引力不算大。

总之，周末或者假期之前的一两天，要是你的股票账户里有闲钱，可以把它扔进逆回购里去。对了，逆回购的交易时间比A股要长半小时，下午3点半才结束，所以平时股票收盘之后，你也可以把闲钱扔进去。熟悉逆回购的同学，肯定知道我还有好多细节和技巧没有来得及一一解释清楚，比如怎么选操作时间的收益率最大呀等等，所以也请各位学霸把你的秘笈敲在留言里，造福一下刚刚听说这个产品的同学。

购买方法如下，依然用东方财富举例，在「天天宝」下面就可以看到「国债逆回购」的选项，进去之后可以看到「沪市」和「深市」两个选项，门槛不同，一个是 10 万，一个是 1 千，酌情选择就好（选收益率高的）。

在这里，我们可以看到在12月12日 28天期的收益率达到了 5.1%，因为刚好跨过了年末这个关口，所以收益率也是不错的。

重点再强调一遍，每逢月末、季度末和年末，一定要看一下「国债逆回购」常常有惊喜哦。

Sat, 13 Dec 2025 02:14:42 GMT

原文地址：https://mp.weixin.qq.com/s/X19hdvZK7LQmNZqY9KJvzQ

在书房2017年5月的《看得懂与看不懂》一文中，我曾写道：「当你能够回答下面四个问题时，就代表看懂了这家企业」：

①这家公司靠销售什么商品和服务获取利润？
②它的客户为何从它这里采购，而不选其他机构的商品或者服务？
③资本的天性是逐利。眼看这家公司坐享丰厚利润，为什么其他资本没有提供更高性价比的商品或服务，抢占了它的市场份额，或逼迫它降低利润空间呢？（更高性价比，即可以是同样质量/数量+更低价格，也可以是同样价格+更高质量/数量）
④假设同行挟巨资，或者其他产业巨头挟巨资参与竞争，该公司能否保住乃至继续扩张自己的市场份额？其实这四个问题就是很多高人喜欢说的“商业模式”，老唐只是把它说的简单粗暴，显得稍微不那么高大上了

当我们能够回答以上四个问题后，就可以⑤给企业估值了。也就是说在我看来，研究一家企业的框架，就是上述①②③④⑤。不管从哪个角度切入具体某家企业，总之万变不离其宗，就是想办法回答上述五个问题。

接下来，老唐以福寿园这只刚刚接触过的企业为例，分享一下从接触一家企业到得出研究结论，应该做的工作和大体的步骤，供朋友们参考。需要提醒的是，老唐也是刚刚接触这家企业的财报，且由于手边琐事影响，到今天为止连财报都还没有看完。

所以，本系列主要谈框架和方法，是示范老唐本人所用的捕鱼之法（且不见得有多高明），不是介绍这条鱼。尤其是文章中，完全可能包含老唐错误或片面的认识——烦请发现者直率指正，谢谢！请千万不要将本系列文章理解为老唐建议在此位置买入福寿园，切记切记

利益声明：截止此刻，老唐本人及本人控制的账户，持有福寿园的数量为0。

一般来说，老唐喜欢投过去已经被证明能够赚到丰厚利润，且经过分析后，认为未来将继续赚到更丰厚利润的企业，不喜欢那些「虽然现在不赚钱，但是未来可能非常美好」的梦想窒息类企业。

因此，我通常用ROE作为筛选企业的第一项标准。

ROE是净利润与账面净资产的比值，它代表企业对掌控的资源的运用能力。

高的ROE说明企业利用当前掌控资源，获取了远超社会无风险收益率的回报水平。

高ROE是投资者的路标和指示牌。它的作用是指引我们去发现某种没有被记录在资产负债表、却能给公司带来收入的「经济商誉」资产。具备高经济商誉的企业，往往都有某种竞争优势企业，值得投资的概率很大。

——注意，这个观点，老唐在2018年3月以《Roe指标的正确应用》和《Roe指标的正确应用（续）》为题，发表在书房。

这角度是老唐原创。以我的阅读经历，我从未见过（或至少没有在中文世界里见过）其他人做过如此阐述。

以福寿园2019年年报为例，公司净资产46亿（为行文简单，数据四舍五入，下同），当年净利润7.4亿，roe≈16%。归母净资产40亿，归母净利5.8亿，归母roe≈15%。

还不错，但也不算特别出彩。

同时我们会发现少数股东权益5.4亿，带来约1.6亿少数股东损益，对于少数股东而言，roe≈1.6/5.4≈30%。

这意味着要么有关联人掏公司腰包，要么是少数股东带有某种没有体现在财报上的特殊资源。究竟是什么，暂且存疑。

老唐在《手把手教你读财报》32页第一行写过：

「经验丰富的投资者，首先看的报表一定是资产负债表。实际上，他们也许会翻阅利润表和现金流量表来相互印证，但最终总是聚焦在资产负债表上。」长期跟踪书房的朋友们都知道，几乎分析任何企业，老唐都会首先搞出一份简化的资产负债表，福寿园也不例外。福寿园2019年度资产负债表简化处理结果（单位人民币亿元）：

读过《手把手教你读财报》的朋友，看到这份简化报表后，头脑里至少应该反映出以下企业特征：

①企业几乎没有有息负债；
②企业即占用上游资金，也占用下游资金，在产业链上相对强势；
③应收账款的数额很少，企业销售主要是预收或现款现货；
④公司有大量现金沉淀，账面类现金资产超过净资产的一半；
⑤商誉显示，企业发生过一次或多次溢价收购。

备注：当年营收18.5亿，有1亿应收账款。在阅读过程会发现，这少量的应收款，是因为火化机销售、园林和景观设计以及向地方民政主管部门提供服务所产生的。创造公司年度营业利润97%的墓地业务，几乎不产生应收账款。沿着这五个要点展开思考，顺理成章地就会产生以下问题：

①企业的主营业务是卖墓穴，类似于房地产卖房子。为什么房地产企业普遍高负债，高杠杆运营，而福寿园却近于无杠杆状态运营。它们之间存在什么样的差异？ ②净资产回报率超过15%，盈利几乎全部为现金的生意，为什么要保留大量资金在手，且几乎完全不借款。是什么制约着公司利用更多资本去获取更多利润的能力？ ③企业为什么通过溢价收购来扩张，收购的出价是否有损害小股东利益的情况？在上市公司下属非全资子公司中占少数股份的合作伙伴，凭什么可以得到比上市公司股东更高的回报率？接下来就可以带着问题去阅读财报全文了，解开上述疑问的过程，就是我们通常所谈到的“企业研究”。后文我不再一一引用原文和出处了，直接说我从财报阅读过程中的思考，大体考虑分为供应端、需求端、行业竞争、政策风险、发展空间、管理层风险以及估值前要做的工作七个角度展开。不过，大家都知道，我写东西是兴趣驱动，不保证有兴趣和时间写完。也不保证一定从这七个角度，或只从这七个角度写。大家有多少看多少吧从供应端看，这门生意和房地产似乎很像，都是从政府手中拿地、然后加工，卖给客户。

但按照我粗读财报的印象，它和房地产生意至少有以下五大区别：第一，土地权属。房地产行业是从政府手中买下土地50到70年的使用权，投入资金建房，然后将土地使用权和房屋一起卖给客户，结束。未来若可以通过缴费延长土地使用权，由客户本人缴费，土地也归属于客户本人。绝大部分城市商品房，客户支付的购房款，名义上是购“房”款，实际上主要款项是购买房子脚下的土地（以清水房论，房屋的建安成本大多介于800~3000之间，地区差异不大）。严格的说，收钱卖掉房子后，房地产公司和这块地、地上的房产及其中的居住者，已经切断联系、分道扬镳了。福寿园是从政府手中获得土地使用权，建墓穴，然后将墓穴的使用权租用给顾客。注意土地使用权并没有转让给客户。客户购买的墓穴是不附带土地证的。未来如果可以通过缴费或其他方式延长土地使用权，由福寿园缴费，土地继续属于福寿园。如果同样用房子来类比说明的话，福寿园的客户相当于只是一次性交清了20年房租及物业费。房子和脚下的土地，法律上的所有权依然属于开发商（福寿园）。

第二，后续黏性。正因为上述土地权属问题，无论是躺在墓穴里的逝者还是其后人，将长期的、无可选择地与福寿园保持紧密的联系和商业往来。如果未来不再续交租金的话，房东（福寿园）是有权力将租客（骨灰盒）驱逐，并将房子重新租给其他房客的。（几十年后放弃缴费并失联的相关风险和处理方式，后面发展空间部分再聊）。虽然房地产开发商一般也同时提供物业服务，但房地产行业的物业服务，本质上讲是任何主体都可以提供的，是红海里近于无差别的竞争。而且物业管理工作琐碎复杂，对人力资源需求很大，很难有巨大的利润空间。所以截至目前为止，房地产企业的物业部门，更侧重于为房屋销售服务，本身并没有什么利润甚至是赔钱的（当做销售费用看待）。福寿园提供墓穴租用后，后续的物业服务只能由福寿园提供。总体来说，墓园的维护工作，变量很少（享受服务的基本不再诞生新要求），大体标准化且极少有紧急事件发生，总体满意度常常超预期。对此类物业服务费用，通常顾客是在办理“入住”手续时，就一次性预缴10~20年的费用。这笔费用少则数百元/年，多则数千元/年，看似不高。但由于墓穴通常占地就1~3个平方，每平米收费标准常常是住宅物业标准的数倍甚至数十倍。该款项中的少部分由监管部门监管使用，专项用于墓园管理，大部分收下就是利润。第三，囤地待涨。房地产行业的囤地行为，是政府层面打击的。比如2020年9月成都市高新区财政局就下过一份文件，禁止高新区内金融机构向李嘉诚旗下的和记黄埔成都公司及其项目提供新增融资、贷款，禁止区内金融机构向和记黄埔进行重大资产重组提供帮助，原因是该公司存在捂地、捂盘等不良行为。墓园的捂地行为几乎是政府要求的。几乎所有的地区都有限制顾客购买墓穴资格的相关政策，例如去世后才能买，年龄超过70或80才能买，重病才能买，一人去世提前预留其他家庭成员墓穴才能买等等。总之原则就是：只有在被证明有需要的时候，才允许购买，尽可能地禁止提前购买，同时也禁止转让。而墓园土地（标准用语殡葬用地），是政府一次性划拨或出售给墓园经营者的，这就必然导致一种房地产行业里被禁止的获利模式，在墓园却是合理合法的，那就是：捂地。而且奇妙的是，墓园土地可以超出土地使用权最后期限销售。比如福寿园有些墓地的使用权已经卖超（意思就是假设土地使用权截止日期是2020年12月31日，但公司可以今天把墓穴卖给顾客，且将管理费用收到2040年），但政府相关部门出具书面函件确认不违规。基本可以确定，未来土地到期后，适当续费就可以继续使用（续费的标准问题，我们放在政策风险部分谈）。正因为这样，福寿园的土地大部分是未开发状态（即捂地）。毕竟伴随着收入水平的提高，未来墓穴的价格几乎可以预期必然上涨（此处投资者可以做公司上市以来，各个墓园平均墓穴售价的数据统计和走势图）。成本不变、售价上涨，无疑会给公司带来更多利润。捂地也是福寿园账面ROE不够高的原因。举个简化的例子说，就是公司买下100单位土地，成本全部计入ROE的分母。产生的利润主要有一明一暗两块，明的是当年销售出去的5份土地带来的，记录在利润表里，是计算ROE的分子。暗的是手中所捂的95份土地当年的增值，不记录在利润表里，不作为ROE的分子。扩张过程中，不断有资本从产生利息收入的货币基金或金融资产，沉淀为只产生暗收益的墓地资产。正是这个原因，导致即使在超高毛利率的销售数据下，ROE看上去却并不怎么诱人。第四，土地的主要获取方式。房地产行业竞争者众多，土地拍卖是各地方政府主要财源，政策监管严格，地价高昂。殡葬用地是受限制用地，是在当地民政部门和国土部门在按照死亡人数预期，规划出合适的数量后，划拨或者挂牌出让。地方政府和媒体对于该类土地的关注度不够，接受划拨或者参与竞争的同行很少，土地基本上无需高价获得。今天我们登陆自然资源部不动产登记中心旗下的中国土地市场网，查询殡葬用地，我们会发现绝大部分依然是划拨方式，拍卖和挂牌出让占比至今仍然极小。

正因为划拨方式为主，所以市场参与者基本上就是现有的业内人士。说透彻一点，就是围绕在民政部门周围，长期与殡葬行业相关的小利益团体。其他投资主体，根本无法预期能否获得经营原材料（殡葬用地），不可能提前进入这个行业去等地。结果就是真有地的时候，也很难及时参与竞争。由于土地的划拨方式，加上殡葬用地主要以不适宜从事其他用途土地为主，所以大部分土地低廉的超乎想象。比如我们点开上面截图的链接，看最近的土地划拨价格（只有部分划拨土地披露成交价格）： 10月17日这块地，4.0481公顷（1公顷=15亩=1万平米）。位于新疆和田市外约75公里处，价格81620元，折合每亩1345元，每平米2元钱（你没有看错单位，就是2元钱/平米）。但若是拍卖，成交价格立刻就不一样了。还是上图，第一个拍卖出让的平阳县那块地5.3263公顷（53263平米=80亩），位于浙江温州市外约50公里处，成交价格4887万元，折合61万/亩或917.5元/㎡。付款要求为2020年11月11日付一半，2020年12月12日付一半。当然，地价还受区域购买力和土地等级差异影响，但两地的墓穴价格差异不可能夸张到数百倍。区域购买力和土地等级解释不了大部分价差，只能归结为拿地模式的差异。第五、土地供应量。房地产的土地供应是源源不断的。政府在不断拓展城市空间，不断将生地变成适合房地产开发的熟地。不仅如此，每一块土地的开发行为本身，实际上也在催熟隔壁地块的供应。任何房地产商的每一份投入和努力，吸引到买房和入住客户的同时，也抬高着隔壁地块的价格，并给自己招来竞争对手。这也是老唐五六年前于某论坛分享过的困惑，2017年6月27日的《生人勿近诞生记》一文引用过：老唐对地产一直不感兴趣，原因是很多年前，一个做地产的熟人，曾经这样吐苦水：

3000万买一块地，求爷爷告奶奶地走通各个环节，起早贪黑担惊受怕的八个杯子五个盖，总算把房子修起来卖的七七八八了，一算账能赚好几千万。

但赚了钱，不能就这么回家抱娃吧，还得买地继续滚啊。隔壁去一看，本钱加上利润，也就勉强购买隔壁差不多大一块地。

这搞房地产的，终极形态到底是什么样子呢？

现金买地—建房换现金—现金买地—建房换现金—现金买地……周而复始。最终留给股东的，不知道是一堆现金，还是一大片荒地？

如果始终不产生或者很少产生现金流，投资者的回报，必须寄期望于牛市来临，这很难让我夜夜安枕。

殡葬用地不同。每个地区人口的年度死亡人数，是有基本稳定的历史统计数据的。未来的预期，也可以根据年龄结构和平均寿命做大致准确的计算。政府会根据这个计算，在土地规划中，规划出未来N年需要的殡葬用地，通过划拨或出售的方式释放，此时土地成本被提前锁定。然后在该规划基本满足需求的时间跨度里，该城市很难再释放新的殡葬土地。墓园经营者的每一分投入，除了提高自己所捂土地的附加值外，不会给自己增加竞争压力。所以，从土地供应量角度看行业格局，墓园和房地产行业的原材料供应有天壤之别，这也决定了两者的经营方式有着巨大的差别。当然，这并不意味着彻底杜绝竞争。毕竟农村荒地、同区域其他墓园，甚至包括一些灵骨塔、庙宇、道观、商品房或小产权房屋以及天葬海葬不葬等多种方式，都有可能成为曲线的行业竞争对手。

基金

Sat, 13 Dec 2025 02:14:42 GMT

记账软件：

基金

蛋卷指数选基金

解读

Sat, 13 Dec 2025 02:14:42 GMT

可转债全称可转换公司债券，就是一种附加了未来选择权的债券，购买了可转债的投资者在一定时间内，可以把债券转换成发行公司的股票。

每张可转债的背后都对应的一家在A股上市的公司的股票，这个股票就叫做正股，比如深南转债对应的正股是深南电路。如果现在深南电路的股价是10元，则10元就是正股价，公司可以和股民约定，比如半年以后，可以拿着股民购买的可转债以12元每股的价格换成股票，这个12就是转股价，当然股民也可以选择不换股票，一年后直接拿连本带息。

这里面会有几个结果：

一年后公司股价涨到15元，超过了转股价，股民依然可以以12元的价格把可转债兑换成股票，这样股民赚到了15-12=3的差价
一年后公司股价跌到了5元，这时候显然没人去转换，因为换了就亏了，此时股民可以拿着不动，就等到期

所以可转债既有债券的属性，也有股票的属性，所以有人说可转债相当于保本的股票

解读

发行可转债必须公开一些信息，挑些不容易理解的解读下：

可转债的利息一般第一年最低，越往后越高，一般是6年，如上图第一年利息0.5%，最后一年3%，为了吸引投资者，大多数的转债都会在到期日前被收回。
转股溢价率：转股价/ 正股价 -1 是衡量可转债是否值得买的重要指标，一般来说，越低越好，最好是负数，这样上涨的概率会更大
债券评级，3A是最高级，安全性高，但收益水平也比较低

需要考虑的问题

作为债券，他的利息很低，一般1%的利息非常低，抵不过通货膨胀，换成股票赚差价是上选
上市公司还不起可转债怎么办？目前监管还是比较严格的，发债公司一般是优质公司，历史上没有发生过违约的可转债

注意事项

阅读募集说明书看清条款

转股价格的向下修正条款 如果正股价持续在转股价85%以下10到15天，上市公司有权下调转股价目的：刺激股民买可转债坏处：转股过多，可能会摊薄股东权益这个是上市公司的权利，不是强制性的

强制赎回条款 一个非常美妙的条款正股价维持在转股价130%(具体数值根据募集说明书)以上15个交易日，公司将以债券面值加应计利息的价格赎回可转债。此时，可转债的持有人已经至少赚了30%的利润了

上市公司的终极目的是让全部股民全部转股，从债主变为股东，这样上市公司就不用还钱了，为达到此目的，需要正股价远高于转股价

有中国特色的赎回条款 回售期内的正股价持续低于转股价70%达30天，上市公司必须以债券面值加上应技利息的价格赎回可转债，大概101-103元这个是义务，强制执行，为了保护股民，相当于硬性保底

四大要素

下调转股价和回售条款都是为了熊市准备的
强制赎回是为了牛市和反弹准备的
在牛市，正股价上涨，可转债的价格也会跟着上涨，不管你是卖出可转债还是转股继续持有股票，都可以享受收益。
在熊市，正股价下跌，可转债可以向下修正转股价，且战且退，一旦市场出现反弹，可以强制赎回条款来获得利益

实操

以东方财富APP为例，需要开户。点新债申购

查看可购买的可转债

选择一个可转债，点申购，输入申购数量，默认10000，点确定，等待即可，一般1-2天就有结果，中签会收到短信通知，告诉你中签数量，比如这里我中了10张中投国债，需要交纳1000，只要保证可用资金里有就行了。

申购流程及常见问题

参考

Sat, 13 Dec 2025 02:14:42 GMT

"浮盈"不是真实盈利。只有我们结束投资以后，才会变成真实的盈利。
情绪周期：利好来了(央视报道，合并，重组，收购)，消息有一个发散的过程->开启阶段->大家蜂拥而至->爆发阶段->分歧阶段（利空和利好消息） ->龙回头（好看的人比较多，第二波...）-> ->没有回头->发酵结束
警惕噪音，没有核心东西支撑2019年拿着一万元冲入股市，能赚多少钱？ 12.12股票学习公开课，好的企业需要有业绩支撑

总的来说，两个方案各有利弊，基金账户方便，比较适合小资金，股票账户交易快速、费用低，比较适合大资金。我建议按照资金多少来决定，如果资金比较少（50 万以下）可以选择基金账户，如果资金量比较大推荐用股票账户。

基金账户 App 在申购、提现上有金额限制，想要完成大笔交易需要重复很多次；股票账户则没有限制，交易几百万也就分分钟；

股票账户的交易规则，必须以 100 份为单位购买，对小资金不友好，不能自由选择金额；

资金量越大，对佣金越敏感，以 50 万为例，股票账户（0.03% 佣金）和基金账户（0.12% 佣金）的手续费差异可以达到 450 元，如果资金更多的话，影响也会等比放大。

Sat, 13 Dec 2025 02:14:42 GMT

使用场景

Sat, 13 Dec 2025 02:14:42 GMT

使用场景

需要将需要部署到集群，但流水线环境不方便直接访问目标K8s集群，可以在K8s里安装runner

然后runner注册到gitlab站点，完成部署操作

GitLab Runner Helm Chart

bash

helm repo add gitlab https://charts.gitlab.io
# 根据 gitlab 站点版本，挑选合适的 helm chart 版本
helm search repo -l gitlab/gitlab-runner
# 下载并解压
helm pull --untar gitlab/gitlab-runner --version=0.64.3
cd gitlab-runner
# 创建一个新的values文件，用来覆盖默认配置
vi values-nfm-dev.yaml

内容如下：

bash

gitlabUrl: https://gitlab.xxxx.cn/
runnerToken: "glrt-HVu1xxxxxyd"
tags: "aws,eit-nfm-dev,executor-k8s"

rbac:
  create: true
  clusterWideAccess: true
  serviceAccountName: gitlab-runner
  ## Define list of rules to be added to the rbac role permissions.
  ## Each rule supports the keys:
  ## - apiGroups: default "" (indicates the core API group) if missing or empty.
  ## - resources: default "*" if missing or empty.
  ## - verbs: default "*" if missing or empty.
  ##
  ## Read more about the recommended rules on the following link
  ##
  ## ref: https://docs.gitlab.com/runner/executors/kubernetes.html#configure-runner-api-permissions
  ##
  rules:
    - resources: ["configmaps", "pods", "pods/attach", "secrets", "services"]
      verbs: ["get", "list", "watch", "create", "patch", "update", "delete"]
    - apiGroups: ['', 'apps', 'networking.k8s.io']
      resources: ["*"]
      verbs: ["*"]
      # resources: ["deployments","services", "secrets","configmaps", "pods","pods/exec","nodes"]
      # verbs: ["list", "create", "patch", "delete"]

runners:
  # runner configuration, where the multi line string is evaluated as a
  # template so you can specify helm values inside of it.
  #
  # tpl: https://helm.sh/docs/howto/charts_tips_and_tricks/#using-the-tpl-function
  # runner configuration: https://docs.gitlab.com/runner/configuration/advanced-configuration.html
  config: |
    [[runners]]
      [runners.kubernetes]
        namespace = "{{.Release.Namespace}}"
        service_account = "{{ .Release.Name }}"
        image = "public.ecr.aws/docker/library/node:lts-alpine"
        privileged = true
        allow_privilege_escalation = true 
        helper_image = "public.ecr.aws/gitlab/gitlab-runner-helper:alpine3.19-x86_64-latest"

安装 runner,

values-nfm.yaml 要放在后面这样可以覆盖values.yaml
upgrade --install 如果不存在就安装，存在就更新

helm upgrade --install --namespace gitlab-runner --create-namespace -f ./gitlab-runner/values.yaml -f ./gitlab-runner/values-nfm.yaml gitlab-runner ./gitlab-runner
k get pod -n gitlab-runner

Docker 的 C/S（客户端/服务器）架构

Sat, 13 Dec 2025 02:14:42 GMT

在 Gitlab Pipeline 里我们经常要将代码打包为 docker image 并推送到镜像仓库，而为了完成 docker push 动作需要定义 service: ['docker:dind']，不然 docker push 无法成功

典型的流水线例子如下：

yaml

stages: 
  - create-image
build-image-job:
  stage: create-image
  image: docker
  services:
    - docker:dind
  script:
    - echo $CI_REGISTRY_PASSWORD | docker Login -U $CI_REGISTRY_USER $CI_REGISTRY --password-stdin
    - docker build -t $$CI_REGISTRY_IMAGE/myapp:1.2-
    - docker push $$CI_REGISTRY_IMAGE/myapp:1.2-
    - docker images

为什么非得定义 services 呢？

这里先从Docker的 C/S 架构讲起

Docker 的 C/S（客户端/服务器）架构

Docker 采用典型的 C/S（客户端/服务器）架构

aiignore

┌─────────────────┐      REST API       ┌─────────────────────────────┐
│   Docker 客户端  │<─────────────────── │      Docker 服务器           │
│   (docker CLI)  │    HTTP/UNIX Socket │     (Docker Daemon)         │
└─────────────────┘                     │   ┌─────────────────────┐   │
                                        │   │  Containers         │   │
                                        │   │  Images             │   │
                                        │   │  Networks           │   │
                                        │   │  Volumes            │   │
                                        │   └─────────────────────┘   │
                                        └─────────────────────────────┘

组件说明

客户端 (Client)

Docker CLI (docker 命令)
Docker API 客户端
Docker Compose
其他第三方工具
服务器 (Server)

服务端 Docker daemon (dockerd)

容器运行时 (containerd)
存储驱动
网络驱动
插件系统

工作流程

用户输入 docker 命令
Docker CLI 解析命令
通过 API 发送请求到 daemon
Daemon 处理请求
返回结果给客户端

示例：运行容器:

docker run nginx

│
├─► 1. CLI 解析命令
│
├─► 2. 发送 API 请求到 daemon
│
├─► 3. Daemon 检查本地是否有镜像
│
├─► 4. 如无镜像则从仓库拉取
│
├─► 5. 创建并启动容器
│
└─► 6. 返回容器 ID 给客户端

客户端环境变量

bash

# 指定 Docker daemon 地址
DOCKER_HOST=tcp://remote-host:2375

# 指定 TLS 设置
DOCKER_TLS_VERIFY=1
DOCKER_CERT_PATH=/path/to/certs

优势

客户端和服务器可以分开部署
支持远程管理
便于第三方集成
支持 TLS 加密
可以通过 API 开发自定义工具

常见使用场景

本地开发:

docker ps

远程管理:

# 通过 TCP 连接远程 daemon
docker -H tcp://remote:2375 ps

进一步

深入了解镜像 docker 和 docker:dind 的具体区别

打开 https://hub.docker.com/_/docker 仔细阅读

发现 docker镜像 docker:28, docker:dind, docker:28-dind 是等价的

而 docker:cli, docker:28-cli 也是等价的，只不过 tag 不一样

进一步查看他们的 Dockerfile: docker:dind 和 docker:cli 直接扔给 Gemini 帮忙分析对比，对于 Docker28 版本的 Dockerfile 得出以下结论：

docker:cli

docker:cli 是基于 alpine:3.21
docker:cli 安装的有 docker 命令行工具, buildx插件,docker-compose插件

docker:dind

docker:dind 是基于 docker:cli, 包含了 docker:cli 的所有功能,并在此基础上增加了运行 Docker daemon 所需的额外组件
额外组件有 git, iptables(IPv4 防火墙), ip6tables(IPv6 防火墙), openssl(SSL 支持), xz, zfs, pigz, e2fsprogs 等文件系统工具
额外组件还有 dockerd (Docker daemon), containerd, ctr, runc 这些容器运行时工具
暴露端口 EXPOSE 2375 2376 # Docker daemon API 端口
特有的存储卷, VOLUME /var/lib/docker # Docker 持久化存储

使用场景

docker:cli:
- 适用于只需要执行 Docker 命令的场景
- 需要连接外部 Docker daemon
docker:dind:
- 适用于需要完整 Docker 环境的场景
- 可以独立运行容器
- CI/CD 环境中的容器构建

网络配置

docker:cli:
- 无特殊网络要求
docker:dind:
- 需要暴露 Docker daemon 端口
- 需要配置网络隔离

参考

https://docs.gitlab.com/ci/services/

https://docs.docker.com/reference/cli/dockerd/

artifacts

Sat, 13 Dec 2025 02:14:42 GMT

artifacts

动态名称

yaml

script:
    # 动态生成时间戳
    - export TIMESTAMP=$(date +'%Y%m%d%H%M%S')
    # 动态生成文件名
    - export ARTIFACT_NAME="${CI_JOB_NAME}-${TIMESTAMP}"
artifacts:
    # 使用动态生成的制品名称
    # 不生效，实际是 default.zip
    name: $ARTIFACT_NAME
    paths:
      - "/target"

参考：https://gitlab.com/gitlab-org/gitlab-runner/-/issues/1664

cache

Use separate caches for protected branches

By default, protected and non-protected branches do not share the cache. However, you can change this behavior.

so we run pipeline on cmss-web2321 branch, the cache url will be like http://minio.minio:9000/gitlab-runner/gitlab-cache/runner/-z_CiEf6/project/441/cmss-web-non_protected but on feature branch, the cache url will become to http://minio.minio:9000/gitlab-runner/gitlab-cache/runner/-z_CiEf6/project/441/cmss-web-non_protected

you can have all branches (protected and unprotected) use the same cache.

Clear the Use separate caches for protected branches checkbox.

script

use !reference to combine script

yaml

stages:
  - demo

.setup:
  script:
    - echo creating environment

.teardown:
  after_script:
    - echo deleting environment

demo-reference:
  stage: demo
  script:
    - !reference [.setup, script]
    - echo running my own command
  after_script:
    - !reference [.teardown, after_script]

output result:

creating environment
echo running my own command
deleting environment

限制分支创建

只有 maintainers 才能合并代码到 develop 分支
只有开发者才能合并代码到 feature 开头的分支

demo1 将父流水线的 artifacts 传递给子流水线

Sat, 13 Dec 2025 02:14:42 GMT

demo1 将父流水线的 artifacts 传递给子流水线

使用 $CI_JOB_TOKEN

project1

yaml

create_artifacts:
  stage: demo
  when: manual
  artifacts:
    paths:
    - newfile.txt
    expire_in: 1 week
  script:
    - CHILD_PROJECT_ID=493
    - CHILD_REF_BRANCH_NAME=feature/cicd
    - echo "CI_JOB_ID:$CI_JOB_ID" >> newfile.txt
    - echo "CI_PIPELINE_ID:$CI_PIPELINE_ID" >> newfile.txt
    # 触发下游项目流水线, 并传递 PROJECT_ID 和 JOB_ID
    - curl --request POST --form "token=$CI_JOB_TOKEN"  --form "variables[PARENT_JOB_ID]=$CI_JOB_ID" --form "variables[PARENT_PROJECT_ID]=$CI_PROJECT_ID" --form ref=${CHILD_REF_BRANCH_NAME} "${CI_SERVER_HOST}/api/v4/projects/${CHILD_PROJECT_ID}/trigger/pipeline"

project2

yaml

download_upstream_artifacts:
  # variables:
  #   CI_DEBUG_TRACE: "true"
  stage: downstream_job
  # download upstream pipeline artifacts:
  needs:
    - pipeline: $PARENT_PIPELINE_ID
      job: create_artifacts
  # 限制仅通过父流水线触发时运行
  rules:
    - if: $CI_PIPELINE_SOURCE == "pipeline"
  script:
    - git config --global user.name "gitlab-ci"
    - git config --global user.email "[email protected]"
    - git config --global --add safe.directory "*"
    - mkdir -p ~/.ssh && chmod 700 ~/.ssh
    - ssh-keyscan ${CI_SERVER_HOST} >> ~/.ssh/known_hosts && chmod 644 ~/.ssh/known_hosts
    - cat "$SSH_PRIVATE_KEY" >  ~/.ssh/gitlab && chmod 500 ~/.ssh/gitlab
    - cat "$SSH_CONFIG" >  ~/.ssh/config

    - echo $PARENT_PROJECT_ID
    - echo $PARENT_JOB_ID
    # 下载 artifacts
    # 会产生问题，因为 project1的流水线是先触发downstream才上传artifacts,有时间差问题，这个时候有可能取不到artifacts
    # 解决方法：将artifacts存到外部存储，不使用 artifact
    - curl --location --output artifacts.zip "${CI_SERVER_HOST}/api/v4/projects/${PARENT_PROJECT_ID}/jobs/${PARENT_JOB_ID}/artifacts?job_token=$CI_JOB_TOKEN"
    - unzip -o artifacts.zip

优化，支持传递 artifacts

project1

yaml

create_artifacts:
  stage: demo
  when: manual
  artifacts:
    paths:
    - newfile.txt
    expire_in: 1 week
  script:
    - CHILD_PROJECT_ID=493
    - CHILD_REF_BRANCH_NAME=feature/cicd
    - echo "CI_JOB_ID:$CI_JOB_ID" >> newfile.txt
    - echo "CI_PIPELINE_ID:$CI_PIPELINE_ID" >> newfile.txt

trigger_downstream:
  stage: deploy
  trigger: 
    include:
      - project: path_to/downstream/repo_name   # Path to the project to trigger a pipeline in
        ref: 'feature/cicd'
        file: '.gitlab-ci.yml'

Sat, 13 Dec 2025 02:14:42 GMT

有时需要让pipeline自己执行 git commit。为此，gitlab runner需要向gitlab认证自己。需要生成一对SSH密钥，实现步骤如下：

创建密钥对，比如本地执行 ssh-keygen -t ed25519 -C "Keypair for FSD"'
公钥做为部署key，存放到gitlab项目中
在项目中setting-cicd中定义一个类型为file的CICD变量，命名为SSH_PRIVATE_KEY
在 gitlab-ci.yml中使用这个文件变量

yaml


default:
  tags: [ mnf, basic, global ]
  image: $DEFAULT_IMAGE
  before_script:
    - git config --global user.name "gitlab-ci"
    - git config --global user.email "[email protected]"
    - mkdir -p ~/.ssh && chmod 700 ~/.ssh
    - ssh-keyscan ${CI_SERVER_HOST} >> ~/.ssh/known_hosts && chmod 644 ~/.ssh/known_hosts
    - eval $(ssh-agent -s)
    - echo "$SSH_PRIVATE_KEY" | tr -d '\r' | ssh-add -
    - git checkout $CI_COMMIT_REF_NAME
    - git submodule update --init
    - git remote set-url origin git@$CI_SERVER_HOST:$CI_PROJECT_PATH.git

Sat, 13 Dec 2025 02:14:42 GMT

1. Create a token on Github

Sat, 13 Dec 2025 02:14:42 GMT

1. Create a token on Github

We want to sync a private repo(https://github.com/mafeifan/vue-press.git) to gitlab

go to https://github.com/settings/tokens to generate a Personal access tokens (classic)

only check scope repo

remember the token: which like ghp_QabT1sLA*****d839uR1alj5S

you can make a test on your local

bash

GITHUB_TOKEN=ghp_QabT1sLA*****j5S
git clone https://ghp_QabT1sLA*****j5S:[email protected]/mafeifan/vue-press.git

2. Create an empty project on gitlab

then go to Settings - repository - Mirroring repositories

fill in the below content in form

Git repository URL: https://github.com/mafeifan/vue-press.git
Authentication method: Username and Password
Username: x-oauth-basic
Password: ghp_QabT1sLA*****j5S

Alternative way

Not to use mirror feature, Use gitlab pipeline to sync code automatically

we need to generate a gitlab token to access gitlab repo

bash

sync-code-from-github:
  image: public.ecr.aws/bitnami/git:2
  stage: sync
  services: []
  when: manual
  script: |
    set -x
    # define $GITHUB_TOKEN and $GITLAB_TOKEN in gitlab pipeline variables first
    git clone https://$GITHUB_TOKEN:[email protected]/mafeifan/vue-press.git
    cd vue-press
    ls
    GITLAB_USERNAME=gitlab
    git remote add gitlab https://$GITLAB_USERNAME:$GITLAB_TOKEN@gitlab.cn/cndevops/vue-press.git
    git push gitlab master

该选择哪一种 Executor？

Sat, 13 Dec 2025 02:14:42 GMT

原文： https://chengweichen.com/2021/03/gitlab-ci-executor.html

使用者在初次踏进 GitLab CI 的世界时，通常按着官方文件一步步照做，多半不会遇到什么问题。唯独有一项东西有可能让新手产生较大的疑惑，那就是该如何选择 Executor。

目前在官方文件上已经有提供了一份 Compatibility chart 帮助使用者选择 Executor。

GitLab Runner 与 Executor 的关系首先，让我们先来解释 GitLab、GitLab Runner 与 Executor 的关系。

让我们拆开来说明，先从 GitLab 与 GitLab Runner 的关系开始。

如上图所示，我们都知道 GitLab Runner 是用来帮助我们执行 CI Job 的工人，而 GitLab 就是这些工人的老板。老板（GitLab）会去查看需求单（.gitlab-ci.yml）建立一张又一张有先后顺序的工单（CI Pipeline），而每一位工人（Runner）则是每隔固定的时间就去询问老板（GitLab）现在有分配给自己的工作（CI Job）吗？现在自己应该做哪一项工作？工人拿到工作后开始执行，并且在执行过程中将处理进度即时填写在工单上。

到这里为止，大部分的人都不太会有什么问题，让我们接着说明 GitLab Runner 与 Executor 的关系。

前面我们将 GitLab 与 GitLab Runner 比喻为老板与工人，那么 Executor 是什么？是工人的工具吗？从我的角度来看，Executor 反而更像是工人的「完成工作的方式」或「工作的环境」。

举例来说，就像我们都曾听过的都市传说，据说在国外有某知名企业的工程师，偷偷将自己的编程开发工作远程外包给印度工程师完成，借此实现上班摸鱼打混还能取得高绩效表扬的神奇故事。当然，偷偷把正职工作私下外包是不正确的行为，但在这个故事中，这就是这位工程师「完成工作的方式」；同理，用口头命令别人做事、自己亲力亲为的传统方法、善用自动化工具或高科技工具辅助、远程连接工作⋯⋯这些都是不同的「完成工作的方式」。

按照上面的比喻，根据您选择的 Executor，决定了 Runner 将会采用何种「方式」以及在哪个「工作环境」中来完成 CI Job。

因此我们可以理解，这意味着身为老板的我们，很可能需要雇佣多位不同的工人。举例来说，炒菜煮饭这种工作，我们就会安排给在厨房工作的厨师；闯入民宅开保险箱这种工作，我们就会安排给RPG游戏中的勇者。根据不同的CI Job，我们有可能需要准备设置了不同Executor的Runner来应对。

目前可选择的Executor

了解Runner与Executor的关系后，接着来认识目前GitLab Runner可选择的Executor有哪些。

【小提醒】目前GitLab官方已表示不会再增加更多的Executor，并且为了保留弹性与扩展性，改为提供Custom这项Executor，如果现有的Executor不能满足你的需求，那就自己定制处理吧！

目前可选择的Executor如下：

Shell：即是Runner直接在自己的Local环境执行CI Job，因此如果你的CI Job要执行各种指令，例如make、npm、composer⋯⋯，则需要事先确定在此Runner的Local环境是否已具备执行CI Job所需的一切相关程序和依赖。
SSH：Runner会通过SSH连接上目标主机，并且在目标主机上执行CI Job。因此你要提供Runner足以SSH连接目标主机的账号密码或SSH Key，也要提供足够的用户权限。当然目标主机上也要事先处理好执行CI Job所需的一切相关程序和依赖。
Parallels：每次要执行CI Job时，Runner会先通过Parallels建立一个干净的VM，然后通过SSH登录此VM并在其中执行CI Job。所以同样的用来建立VM的Image是先要准备好执行CI Job所需的一切相依程式与套件，这样Runner建立好的环境才能正确地执行CI Job。另外，当然架设Runner的主机上，记得要安装好Parallels。
VirtualBox：同上，只是改成用VirtualBox建立干净的VM。同样架设Runner的主机上，记得要安装好VirtualBox。
Docker：Runner会通过Docker建立干净的Container，并且在Container内执行CI Job。因此架设Runner的主机上，记得要安装好Docker，另外在规划CI Pipeline时也要记得先准备能顺利执行CI Job的各种Docker image。在CI Pipeline中采用Container已是十分普遍的做法，建议大家可以优先评估Docker executor是否适合你的工作场景。
Docker Machine：延续上一个 Executor，此种 Executor 一样会通过 Container 来执行 CI Job，但差别在于这次你原本的 Runner 将不再是一般的工人了，它已经摇身一变成为工头，每当有工作（CI Job）分派下来，工头就会去自行招募工人（auto-scaling）来执行工作。因此倘若在短时间内有大量的工作需要执行，工头就会去招募大量的工人迅速地将工作们全部搞定。需要注意的是因为招募工人需要一些时间，故有时此种 Executor 在启动时会需要多花费一些时间。
Kubernetes：延续前两个与 Container 相关的 Executor，这次直接进入超级工头 K8s 的世界。与前两种 Executor 类似，但这次 Runner 操控的不是小小的 Docker engine 了，而是改为操控 K8s。此种 Executor 让 Runner 可以透过 K8s API 控制分配给 Runner 使用的 K8s Cluster 相关资源。每当有 CI Job 指派给 Runner 时，Runner 就会透过 K8s 先建立一个干净的 Pod，接着在其中执行 CI Job。当然使用此种 Executor 依然记得先准备好能顺利执行 CI Job 的各种 Container image。
Custom：如果上面这七种 Executor 都不能让你满意，那就只好请客官您自行动手啦！Custom Executor 即是 GitLab 提供给使用者自行定制 Executor 的管道。

该选择哪一种 Executor？

简单来说就是根据你的需要来选择 Executor！

如果你的团队已经很熟悉 Container 技术，不论是开发、测试及 Production 环境都已全面拥抱 Container，那当然选择 Docker executor 是再正常不过了。更不用说如果 Production 环境已经采用 K8s，那么 CI/CD Pipeline 想必也离不开 K8s 的魔掌，Runner 势必会选用 Kubernetes executor。（但还是别忘了凡事都有例外。）

假如只有开发环境拥抱 Container，但实际上测试机与 Production 环境还是采用实体服务器或 VM，这时你可能就会准备多个 Runner 并搭配多种 Executor。例如 Build、Unit Testing 或某些自动化测试的 CI Job 让 Docker executor 去处理；而像是 Performance testing 则用 VirtualBox executor 开一台干净的 VM 并部署程序来执行测试。

又或者，你的公司有非常多项目正在同步进行中，同时需要执行的 CI Job 时多时少，那么可以 auto-scaling 的 Docker Machine executor 也许会是一个可以考虑的选择。事实上 gitlab.com 提供给大家免费使用的 Shared Runner，就有采用 Docker Machine executor。

再举例，假如有某个 CI Job 只能在某台主机上执行，也许是为了搭配实体服务器的某个硬件装置、也许是基于安全性或凭证的缘故，在这种情况下很可能你会用到 SSH executor，或甚至是在该主机上安装 Runner 并设置为 Shell executor，让特定的 CI Job 只能在该 Runner 主机上执行。

最后，也有可能你因为刚好身处在一个完全没有 Container 知识与技能的团队，所以才只好选择 Shell、SSH、VirtualBox 这些不需要碰到 Container 的 Executor。

【小提醒】由于 SSH、VirtualBox、Parallels 这三种 Executor，Runner 都是先连上别的主机或 VM 之后才执行 CI Job 的内容，因此都不能享受到 GitLab Runner 的 caching feature。

（官网文件也有特别提醒这件事。）

结语

GitLab Runner 及 Executor 与 CI/CD Pipeline 的规划密切相关，在实务上我们经常会准备多种 Runner 因应不同的情境，也许是类似下面这样常态准备 3 台 Runner。

Docker executor｜供一般的 CI Job 使用。
Docker Machine executor｜供 CI Job 大爆发堵车时使用。
SSH 或 Shell executor｜供 Production Deploy 或某些有较高安全性考量

安装开源版Gitlab

Sat, 13 Dec 2025 02:14:42 GMT

安装开源版Gitlab

前提

先阅读文档

https://github.com/sameersbn/docker-gitlab

https://www.damagehead.com/docker-gitlab/

测试环境下最简单的方式是使用 docker-compose

Amazon Linux 2023 下载安装docker

EC2 基本信息

系统: Amazon Linux 2023
磁盘: 100G
规格: t3.large 2核8G

bash

sudo bash
cd ~
yum install docker -y
systemctl start docker
# 测试 docker
docker run hello-world

curl -SL https://github.com/docker/compose/releases/download/v2.29.6/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose
/usr/local/bin/docker-compose /usr/bin/docker-compose
chmod +x /usr/local/bin/docker-compose
# 测试 docker-compose
docker-compose

安装 gitlab

准备下面的yaml文件，执行 docker-compose up

浏览器打开http：//localhost:10080并使用默认用户名和密码登录：

username: root
password: 5iveL!fe

docker-compose.yml

yaml

version: '2.3'

services:
  redis:
    restart: always
    image: redis:6.2
    command:
    - --loglevel warning
    volumes:
    - redis-data:/data:Z

  postgresql:
    restart: always
    image: sameersbn/postgresql:14-20230628
    volumes:
    - postgresql-data:/var/lib/postgresql:Z
    environment:
    - DB_USER=gitlab
    - DB_PASS=password
    - DB_NAME=gitlabhq_production
    - DB_EXTENSION=pg_trgm,btree_gist

  gitlab:
    restart: always
    image: sameersbn/gitlab:17.5.0
    depends_on:
    - redis
    - postgresql
    ports:
    - "10080:80"
    - "10022:22"
    volumes:
    - gitlab-data:/home/git/data:Z
    healthcheck:
      test: ["CMD", "/usr/local/sbin/healthcheck"]
      interval: 5m
      timeout: 10s
      retries: 3
      start_period: 5m
    environment:
    - DEBUG=false

    - DB_ADAPTER=postgresql
    - DB_HOST=postgresql
    - DB_PORT=5432
    - DB_USER=gitlab
    - DB_PASS=password
    - DB_NAME=gitlabhq_production

    - REDIS_HOST=redis
    - REDIS_PORT=6379

    - TZ=Asia/Chongqing
    - GITLAB_TIMEZONE=Chongqing

    - GITLAB_HTTPS=false
    - SSL_SELF_SIGNED=false

    - GITLAB_HOST=localhost
    - GITLAB_PORT=10080
    - GITLAB_SSH_PORT=10022
    - GITLAB_RELATIVE_URL_ROOT=
    - GITLAB_SECRETS_DB_KEY_BASE=long-and-random-alphanumeric-string
    - GITLAB_SECRETS_SECRET_KEY_BASE=long-and-random-alphanumeric-string
    - GITLAB_SECRETS_OTP_KEY_BASE=long-and-random-alphanumeric-string

    - GITLAB_ROOT_PASSWORD=
    - GITLAB_ROOT_EMAIL=

    - GITLAB_NOTIFY_ON_BROKEN_BUILDS=true
    - GITLAB_NOTIFY_PUSHER=false

    - [email protected]
    - [email protected]
    - [email protected]

    - GITLAB_BACKUP_SCHEDULE=daily
    - GITLAB_BACKUP_TIME=01:00

    - SMTP_ENABLED=false
    - SMTP_DOMAIN=www.example.com
    - SMTP_HOST=smtp.gmail.com
    - SMTP_PORT=587
    - [email protected]
    - SMTP_PASS=password
    - SMTP_STARTTLS=true
    - SMTP_AUTHENTICATION=login

    - IMAP_ENABLED=false
    - IMAP_HOST=imap.gmail.com
    - IMAP_PORT=993
    - [email protected]
    - IMAP_PASS=password
    - IMAP_SSL=true
    - IMAP_STARTTLS=false

    - OAUTH_ENABLED=false
    - OAUTH_AUTO_SIGN_IN_WITH_PROVIDER=
    - OAUTH_ALLOW_SSO=
    - OAUTH_BLOCK_AUTO_CREATED_USERS=true
    - OAUTH_AUTO_LINK_LDAP_USER=false
    - OAUTH_AUTO_LINK_SAML_USER=false
    - OAUTH_EXTERNAL_PROVIDERS=

    - OAUTH_CAS3_LABEL=cas3
    - OAUTH_CAS3_SERVER=
    - OAUTH_CAS3_DISABLE_SSL_VERIFICATION=false
    - OAUTH_CAS3_LOGIN_URL=/cas/login
    - OAUTH_CAS3_VALIDATE_URL=/cas/p3/serviceValidate
    - OAUTH_CAS3_LOGOUT_URL=/cas/logout

    - OAUTH_GOOGLE_API_KEY=
    - OAUTH_GOOGLE_APP_SECRET=
    - OAUTH_GOOGLE_RESTRICT_DOMAIN=

    - OAUTH_FACEBOOK_API_KEY=
    - OAUTH_FACEBOOK_APP_SECRET=

    - OAUTH_TWITTER_API_KEY=
    - OAUTH_TWITTER_APP_SECRET=

    - OAUTH_GITHUB_API_KEY=
    - OAUTH_GITHUB_APP_SECRET=
    - OAUTH_GITHUB_URL=
    - OAUTH_GITHUB_VERIFY_SSL=

    - OAUTH_GITLAB_API_KEY=
    - OAUTH_GITLAB_APP_SECRET=

    - OAUTH_BITBUCKET_API_KEY=
    - OAUTH_BITBUCKET_APP_SECRET=
    - OAUTH_BITBUCKET_URL=

    - OAUTH_SAML_ASSERTION_CONSUMER_SERVICE_URL=
    - OAUTH_SAML_IDP_CERT_FINGERPRINT=
    - OAUTH_SAML_IDP_SSO_TARGET_URL=
    - OAUTH_SAML_ISSUER=
    - OAUTH_SAML_LABEL="Our SAML Provider"
    - OAUTH_SAML_NAME_IDENTIFIER_FORMAT=urn:oasis:names:tc:SAML:2.0:nameid-format:transient
    - OAUTH_SAML_GROUPS_ATTRIBUTE=
    - OAUTH_SAML_EXTERNAL_GROUPS=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_EMAIL=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_NAME=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_USERNAME=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_FIRST_NAME=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_LAST_NAME=

    - OAUTH_CROWD_SERVER_URL=
    - OAUTH_CROWD_APP_NAME=
    - OAUTH_CROWD_APP_PASSWORD=

    - OAUTH_AUTH0_CLIENT_ID=
    - OAUTH_AUTH0_CLIENT_SECRET=
    - OAUTH_AUTH0_DOMAIN=
    - OAUTH_AUTH0_SCOPE=
 
    - OAUTH_AZURE_API_KEY=
    - OAUTH_AZURE_API_SECRET=
    - OAUTH_AZURE_TENANT_ID=

volumes:
  redis-data:
  postgresql-data:
  gitlab-data:

生产建议

postgresql 和 redis 不要和 gitlab 运行在同一台服务器，最好使用独立数据库，避免单点故障

目的

Sat, 13 Dec 2025 02:14:42 GMT

目的

通过 IP:10080 访问 gitlab 站点不太优雅，也不方便识记我们给 gitlab 站点绑定个域名并且带上SSL证书

申请免费SSL证书

由于我的 mafeifan.com 域名解析是托管在腾讯云, 可以在腾讯云的SSL证书服务里购买免费的域名证书

时长只有3个月

选择 nginx 类型，下载得到 gitlab.mafeifan.com_nginx.zip

登录服务器安装nginx

bash

sudo yum install nginx -y
# 创建一个专门存放证书的目录
sudo mkdir -p /etc/nginx/my_certs

将证书放到指定目录

/etc/nginx/my_certs/gitlab.mafeifan.com_bundle.crt
/etc/nginx/my_certs/gitlab.mafeifan.com.key

新建nginx配置文件 /etc/nginx/conf.d/gitlab.mafeifan.com-80-443.conf 内容如下：

bash

server {
    listen 80;
    server_name gitlab.mafeifan.com;
    rewrite ^(.*) https://$host$1 permanent;
}

server {
  listen 443;
  server_name gitlab.mafeifan.com;
  ssl on;
  ssl_certificate /etc/nginx/my_certs/gitlab.mafeifan.com_bundle.crt;
  ssl_certificate_key /etc/nginx/my_certs/gitlab.mafeifan.com.key;
  ssl_session_timeout 5m;
  ssl_protocols TLSv1 TLSv1.1 TLSv1.2;
  ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:HIGH:!aNULL:!MD5:!RC4:!DHE;
  ssl_prefer_server_ciphers on;
  location / {
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header Host $http_host;
    proxy_pass http://127.0.0.1:10080;
  }
}

修改docker-compose.yml

GITLAB_HTTPS=true
SSL_SELF_SIGNED=false

GITLAB_HOST=gitlab.mafeifan.com
GITLAB_PORT=443

重启

docker-compose down && docker-compose up -d

问题

gitlab 提供了一个 WebIDE 在线编辑代码的编辑器,发生了地址错误的情况

根据文档，把地址改为 https://gitlab.mafeifan.com/-/ide/oauth_redirect

目的

Sat, 13 Dec 2025 02:14:42 GMT

目的

参考文档

https://help.aliyun.com/document_detail/36576.html

yaml


- [email protected]
- [email protected]
- [email protected]

- SMTP_ENABLED=true
- SMTP_DOMAIN=www.aliyun.com
- SMTP_HOST=smtp.qiye.aliyun.com
- SMTP_PORT=465
- [email protected]
- SMTP_PASS=xxxxxxx
- SMTP_STARTTLS=false
- SMTP_TLS=true  
- SMTP_AUTHENTICATION=login

问题

https://github.com/sameersbn/docker-gitlab/issues/2334

目的

Sat, 13 Dec 2025 02:14:42 GMT

目的

问题

1 权限管理

Sat, 13 Dec 2025 02:14:42 GMT

原文：https://www.yuque.com/rangwu/gitlab/guqi8aud217uaab7

特别说明

极狐GitLab工作流是极狐GitLab团队内部的DevOps工作流，也是极狐GitLab面向企业推荐的参考工作流。本文将基于极狐GitLab企业版（专业版或旗舰版），参照极狐GitLab工作流，通过一个示例项目完整演示DevOps的全流程，覆盖权限管理、组织管理、需求管理、开发管理，并形成闭环。

由于DevOps是一项工程实践，需要结合企业的组织架构、业务流程、技术栈与工具链、人员能力进行落地。以上内容每家企业均存在较大差异，甚至同一家企业不同团队或不同时期也存在差异。故本文旨在向企业提供一个参考工作流，帮助企业快速了解极狐GitLab相关能力，也可用于改进企业内部的DevOps流程。

本文可面向企业DevOps工程师或熟悉DevOps的研发、运维团队成员及Leader。阅读以下内容需要至少了解Git的使用方式（代码推拉）、版本控制与分支策略、软件测试、CI/CD、制品库、容器技术（Docker）、监控运维等基础知识。需熟悉GitLab基本功能，如史诗议题、合并请求、GitLab CI脚本、GitLab Runner类型与部署方式。本文不会对上述内容进行深度展开，如果您对以上内容尚不熟悉，本文中的内容可能会对您造成较大困扰，建议您通过极狐GitLab原厂培训服务快速掌握极狐GitLab和DevOps的基础知识。

以下内容可在 https://presales-demo.jihulab.com/mycompany/project-x 中查看配套的demo示例

[TOC]

1 权限管理

1.1 用户角色

极狐GitLab内置6种用户角色，可根据不同的场景、用户职能进行分配。

用户角色	权限说明	场景示例
Guest	无法对私有化项目做贡献，只能查看议题和留言。	项目审计人员
Reporters	只读贡献者，可访问代码库但无法写入，可以编辑议题。	产品经理
Developers	直接贡献者，代码库可读写，受更高级权限管理（如保护分支）。	开发人员
Maintainers	项目维护者，可对代码库进行管理工作，如分配权限、项目设置。不具备删除权限。	项目负责人
Owners	项目管理员，能够对群组、项目进行全面管理。	部门总监项目负责人
Admin	实例管理员，可对整个GitLab实例进行配置管理。	系统管理员

1.2 自定义角色[旗舰版]

极狐GitLab支持自定义角色，属于旗舰版功能，该功能正在持续完善。

2. 组织管理

2.1 群组

极狐GitLab的群组类似文件夹，可以包含多个项目（代码库），群组可以嵌套，类似文件夹、子文件夹。

群组可作为部门组织管理代码库，也可作为虚拟项目组织管理代码库。

操作步骤：

创建一级群组项目X
在群组项目X下创建一个项目（代码库）子项目A，创建两个子群组子项目B、子项目C。
在子群组子项目B、子项目C中创建项目（代码库）模块A、模块B、模块C

不同开发语言划分组织的参考经验：

若使用Java、Python等语言，能实现模块化开发，能通过流水线独立部署，或能打包成jar、pip等制品，通过包管理器向其他项目提供引用，这类项目建议参考子项目B、子项目C，分成子群组和多个代码库来管理。
若使用C/CPP语言，没有太好的包管理工具，模块之间依靠完整源码编译，这类项目建议参考子项目A，将整个C/CPP项目放到一个项目（代码库）中，通过文件夹来区分模块。

2.2 项目

极狐GitLab的项目就是指代码库，隶属于群组。

群组、项目与角色关系：

可将用户在群组级别进行角色授权，该用户具备该群组以及该群组的所有子群组、所有项目（代码库）的权限，即继承权限。
可将用户在项目级别进行角色授权，该用户只具备该项目（代码库）的权限。

2.3 范围标记[专业版]

极狐GitLab使用Label标记来给后续需求管理中使用到的史诗、议题赋予一些意义，可以理解为自定义字段。

操作步骤：

在群组项目X左侧边栏“管理——标记”中新建以下标记，这些标记可以在该群组以及该群组的所有子群组、所有项目（代码库）中使用。
管理员也可以参考文档在GitLab全局设置标记，GitLab中所有的群组、项目都可使用。
创建一组类型标记，用于标识议题的类型是“功能”还是“缺陷”。其中::是用于设置范围标签，该标签是一组键值对，具有排他性。如下面例子中，某个议题同一时间只能具备其中一个type标记，即type要么是bug，要么是feature。

type::bug
type::feature

创建一组状态标记，用于标识议题的状态是“待处理”、“进行中”还是“已完成”。

status::todo
status::doing
status::done

创建一组优先级标记，用于标识议题的优先级是“高”、“中”还是“低”。

priority::high
priority::mid
priority::low

2.4 群组/实例模板[专业版]

极狐GitLab支持使用模板来为后续需求管理中使用到的议题设置一些格式化内容，用来提高工作规范性和效率。

操作步骤：

在群组项目X中创建一个项目（代码库）模板，创建两个文件.gitlab/issue_templates/feature.md、.gitlab/issue_templates/bug.md，用于作为“功能”和“缺陷”的标准模板

内容如下：

bug.md

### 步骤
1.
2.
3.

### 结果


### 期望


### 环境
- 机型：
- 版本：

/label ~"type::bug" ~"priority::low" ~"status::todo"

feature.md

### 用户故事
作为 [角色]，我 [想要实现/达到什么目的]，[从而获得怎样的价值/解决什么问题]。

### 客户用例
1.
2.
3.

### 设计文档
1. 产品原型图见: xxxxxx
2. 产品设计图见: xxxxxx

/label ~"type::feature" ~"status::todo"

在群组项目X的“设置——通用——模板”中，选择项目模板作为该群组的默认模板，该模板可以在该群组以及该群组的所有子群组、所有项目（代码库）中使用。
管理员也可以参考文档在GitLab全局设置模板，GitLab中所有的群组、项目都可使用。

3. 需求管理

说明：若您已经使用Jira、PingCode、Ones、LigaAI等国内外主流项目管理工具、或使用自研、定制开发的项目管理工具，以下内容仅供参考。您也可以直接跳到第4章了解开发管理的相关内容，在该章节中也会介绍极狐GitLab如何与这些第三方项目管理系统做集成，并打通整个流程。若您没有使用线上化的项目管理工具，还在使用电子文档、聊天工具来进行需求管理，则建议您详细阅读以下内容。

3.1 史诗[专业版]

极狐GitLab使用Epic史诗来管理相对比较宏大的业务目标或原始需求，他一般由项目经理、产品经理负责创建并维护。史诗是建立在群组上的。

操作步骤：

在群组项目X的“计划——史诗”中，创建两个史诗，并设置大致的时间计划
具备群组项目X角色权限的用户都可以看到所有的史诗内容。
史诗将在后续阶段被拆分、细化、形成具体的研发任务，也就是议题，史诗和议题是父子关系。

3.2 子史诗[旗舰版]

如果一项史诗任务过于复杂，可能还需拆分成多个依然比较宏大的史诗，这里就可以使用到子史诗

3.3 路线图 roadmap[专业版]

路线图是针对史诗的排期展示。设置史诗的时间计划后，项目经理、产品经理可以查看路线图。操作步骤：

在群组项目X的“计划——路线图”中，通过甘特图来展示所有史诗的排期和进度。
史诗的进度依赖于与它关联的议题，如一个史诗关联了4个议题，其中2个议题已完成（已关闭），那么进度就是50%。
如果有子史诗，路线图中可会显示子史诗、史诗的排期和进度。

3.4 里程碑 Epic

史诗和路线图是项目经理、产品经理对一些原始需求的大致排期。当某些原始需求已经有近期明确的开发计划后，应创建里程碑。

里程碑标识近期一段时间明确的开发计划，如一次版本发布、一次敏捷迭代等。

操作步骤：

在群组项目X的“计划——里程碑”中，创建两个里程碑，通过版本号进行命名，并设置里程碑的时间。
里程碑将关联一些具体的、细化的开发任务或者需要处理的缺陷，也就是下文中的议题。

3.4.1 燃起图、燃尽图[专业版]

当里程碑中的议题根据第3.5章节被创建，随后根据第4章节完成开发、集成、部署，最后议题被手动关闭或根据4.4.5.5在合并请求被执行后自动关闭，意味着这个功能开发完成。

议题在里程碑中会实时显示状态，并通过燃起图、燃尽图来展示整个里程碑的进展，也可以在里程碑结束后帮助团队回顾或用于帮助团队评估下一个里程碑的工作计划。

3.5 议题 issue

极狐GitLab使用Issue议题来管理需求任务、Bug缺陷。它一般由产品经理创建并由研发人员维护。

3.5.1 议题管理

议题是建立在项目（代码库）上的，它可以与史诗进行关联，也可以与史诗无关，即只与该项目（代码库）相关。操作步骤：

拥有群组项目X角色权限的项目管理人员，可以查看该群组所有项目（代码库）的议题。

仅拥有项目（代码库）的开发人员，只可以查看与他工作相关的议题。
所以创建议题应明确该议题与哪一个项目（代码库）相关，如果议题创建到错误的项目（代码库）中，可以参考文档将议题移动到正确的项目中。

3.5.2 需求议题

用议题管理需求任务。

操作步骤：

在群组项目X下的项目（代码库）子项目A的“计划——议题”中创建议题
选择之前创建的名为feature的模板来列出开发任务的描述格式。
将该议题关联到史诗“监控模块开发”，关联到里程碑“1.0.0”。
添加了其他几个议题，并与史诗、里程碑进行关联
添加了一个议题，只关联里程碑，不关联史诗。

3.5.3 缺陷议题

用议题管理缺陷，与管理开发任务没有什么不同，只是用Lable来标识这个议题是缺陷Bug。

另外缺陷议题一般不与史诗进行关联，只与各项目（代码库）相关。若项目为多模块模式进行开发，测试人员无法判断该缺陷属于哪个项目（代码库），可以向最终提测的应用项目（代码库）提交缺陷，研发团队内部定位后再通过移动议题将缺陷议题转移到对应的项目中。
通过选择之前创建的名为bug的模板来列出缺陷Bug的描述格式。
缺陷议题（缺陷）可以与需求议题（功能）进行关联。

3.6 议题权重[专业版]

在敏捷开发中，一般使用故事点、评估点来估算用户故事。在极狐GitLab中可使用权重来实现该功能。

操作步骤：

进入指定的议题，给议题设置权重。
在群组项目X的里程碑中，可查看该里程碑关联的议题的总权重。

3.7 工时统计

在瀑布开发中，或者对工时统计有要求的场景中，一般需要在开发前填写估算工时，开发结束后填写实际工时，用于做排期和分析。在极狐GitLab中可使用工时来实现该功能。

操作步骤：

进入指定的议题，给议题设置预估工时。
在议题处理过程中，可以多次给议题设置实际工时，如每天进行填写，最后实际工时将会累加。
在议题中可以查看时间追踪报告，看到实际工时的说明和累加历史。在群组项目X的里程碑中，可查看该里程碑关联的议题的总工时统计。

3.8 议题看板 issue board[专业版]

极狐GitLab支持灵活的自定义看板，来对议题进行管理、协作。

3.8.1 任务看板

操作步骤：

在群组项目X“计划——议题看板”中编辑“Development”看板。
设置里程碑=1.0.0、标记=type::feature，即看板中只包含里程碑为1.0.0且类型为feature的议题。
创建列表，将标记为status::todo、status::doing、status::done的列表分别加入看板。
议题可在列表之间拖动。
后续只需要编辑看板的里程碑，即可用于不同里程碑周期下的任务看板管理。

3.8.2 缺陷看板

操作步骤：

在群组项目X“计划——议题看板”中创建“Bug”看板。
设置里程碑=1.0.0、标记=type::bug，即看板中只包含里程碑为1.0.0且类型为bug的议题。
参考任务看板，创建列表并进行管理。

3.9 指派议题[专业版]

将议题指派给一个或多个开发人员，用于分配开发任务、或处理Bug缺陷。

操作步骤：

进入指定的议题，给议题设置指派人。
被指派的人员可以收到邮件通知，并可在“代办事项列表”中进行展示和跟踪。

4 开发管理

4.1 创建分支

4.1.1 分支策略

极狐GitLab推荐的分支策略GitLab Flow提供了3种子模型来匹配不同的业务场景。

本文以第三种子模型，也就是多版本并行开发场景为例，它的完整分支模型如下：

新功能的开发应创建一个新的feature分支，如feature/monitor-temperature，并创建从feature/monitor-temperature分支到main分支的合并请求。开发人员在该分支下开发，开发完成后通过流水线实现自动编译、打包、单元测试、质量扫描并发布到测试环境。测试人员进行该模块的功能测试，测试完成并通过评审后将该分支合并到main分支。合并结束后自动删除feature/monitor-temperature分支。
Bug的修复应创建一个新的fix分支，如fix/tag-version-diff，并创建从fix/tag-version-diff分支到main分支的合并请求。开发人员在该分支下修复Bug，开发完成后通过流水线实现自动编译、打包、单元测试、质量扫描并发布到测试环境。测试人员进行该模块的功能测试，测试完成并通过评审后将该分支合并到main分支。合并结束后自动删除fix/tag-version-diff分支。
每个功能、每个Bug都应创建新分支，并在新分支中独立开发，应避免多个功能、Bug在同一个feature分支或fix分支中开发，这样会导致管理混乱、难以回滚、容易冲突、不利于评审。
创建release分支来管理版本，同一时间可能维护多个版本，如release/13.0.0分支、release/14.0.0分支、release/15.0.0分支。
当需要发版时，从main分支向release/15.0.0分支发起合并请求。
基于release分支编译、构建、打包，发布到测试环境，测试人员进行集成测试。
当release分支发现有功能缺失或者存在缺陷，还应参照第1、2步的内容，创建feature或fix分支来开发新功能或修复缺陷，再向main分支合并。合并通过后使用cherry-pick拣选功能将这个合并请求拣选到指定的release分支，如release/13.0.0、release/14.0.0、release/15.0.0。
直到release分支测试无误后，在release分支上打标签tag来标识一个新的小版本，如15.0.1。
可以在打标签tag时触发流水线，基于tag编译、构建、打包，然后发布到生产环境。

需要注意，分支策略因研发流程而异，企业应该根据实际情况调整，但建议在企业在项目中尽可能推行统一的分支策略，以便于管理。

4.1.2 分支命名规则[专业版]

当确定分支策略后，应通过极狐GitLab推送规则来对分支命名进行校验，确保开发人员创建分支时能严格遵守分支策略，避免管理混乱。

操作步骤：

在子项目A“设置——仓库——推送规则”中配置分支名称校验规则(cherry-pick|feature|fix|release)\/*。
可参考文档和文档，在GitLab实例级别或群组级别设置推送规则，这些推送规则仅对GitLab实例或群组中新创建的项目生效。
当创建的分支名称不符合校验规则，则提示无法创建分支

4.1.3 手动创建分支

在指定项目，如子项目A“代码——分支”中，新建分支feature/monitor-temperature，用来开发#2号需求“获取温度数据”

可在指定项目，如子项目A“代码——分支”查看并切换分支

创建合并请求，从feature/monitor-temperature合并到main。

4.1.4 基于议题创建分支[专业版]

极狐GitLab也支持基于议题快速创建分支和合并请求。

操作步骤：

在指定议题中，下拉“创建合并请求”，选择“创建合并请求和分支”，填写“分支名称”，即可快速创建分支和合并请求。

4.2 保护分支

当确定分支策略后，还应确保研发人员只能在开发分支如feature、 fix分支进行代码提交，应拒绝开发人员直接向主干分支如main分支或发版分支如release分支提交代码。开发分支和主干分支、发版分支之间必须通过合并请求，走评审或确认机制传递代码，避免管理混乱、引起冲突。在极狐GitLab中可以通过保护分支来达到以上目的。

4.2.1 角色级保护

基于用户角色设置保护分支，可能会导致管理失控。因为Maintainer角色具备的权限较多，除了基本的管理权限外，还能给项目设置新的人员及角色权限，即引入更多的Maintainer角色，无法满足企业合规管理的需求。

操作步骤：

在指定项目，如子项目A“设置——仓库——受保护分支”中，新建保护分支，输入release*来匹配所有的release分支，包括后续创建的release分支也自动匹配为受保护分支。
由于GitLab项目中main分支是默认分支，所以本身已经是受保护分支。
调整受保护分支，允许Maintainer角色可以合并，No One可以推送，即只有Maintainer角色通过确认合并请求，才能向受保护的main分支release*分支传递代码。

4.2.2 用户级保护[专业版]

基于用户设置保护分支，可将合并、推送权限进行细粒度控制，仅允许一个人或几个人具备合并、推送权限，可有效规避代码越权提交，管理失控等问题。

与“角色级保护”设置一样，可在“允许合并”、“允许推送和合并”处选择具体的用户，支持多选。

4.2.3 群组保护分支[专业版]

极狐GitLab支持在群组级别设置保护分支，将对该群组的所有项目（代码库）生效，且在项目中不能修改、覆盖群组级别的保护分支。

4.3 分支开发

4.3.1 代码推送规则[专业版]

在开发分支下提交代码，应遵循统一、规范的提交格式，否则容易导致管理混乱，降低协同效率。如下图：

左图是不规范的代码提交，意义不清、描述重复。
右图是知名项目Angular.js的代码提交，遵循统一的提交规范类型（范围）: 描述（需求编号），该规范也被称为Angular规范，是业内使用比较普遍的提交规范极狐GitLab推送规则可以对代码提交的格式、文件类型、文件大小以及提交人的身份进行校验，确保入库的代码符合企业统一的规范，为研发协同以及后续的代码评审打下良好的基础。操作步骤：

在子项目A“设置——仓库——推送规则”中配置推送规则。
勾选“拒绝未经验证的用户 Reject unverified users”，即验证开发人员本地git配置的user.email是不是当前执行代码推送的GitLab用户的已验证的邮箱。
勾选“拒绝不一致的用户名 Reject inconsistent user name”，即验证开发人员本地git配置的user.name是不是当前执行代码推送的GitLab用户的用户名。
设置“提交信息中的要求表达式”为(feat|fix|doc|style|refactor|pref|test|ci|revert):.+，您也可以自定义其他表达式。若提交信息格式不符合正则表达式，则拒绝推送。
根据需要设置“禁止的文件名”，如(jar|exe|tar.gz|tar|zip)$。推送文件中若包含这些文件类型，则拒绝推送。
根据需要设置“最大文件大小”，如20。单个推送文件若超过该大小，则拒绝推送，除非使用LFS来进行推送。
可参考文档，在GitLab实例级别或群组级别设置推送规则，这些推送规则仅对GitLab实例或群组中新创建的项目生效。

4.3.2 代码开发与推送

在4.1章节中，新建了分支feature/monitor-temperature，用来开发#2号需求“获取温度数据”。现在可以模拟代码开发和提交推送过程。

将子项目A的代码克隆到本地。
在本地将子项目A的代码切换到feature/monitor-temperature分支。
新增一些代码文件，如README.MD，并向文件中写入一些内容。
本地提交代码，代码提交格式应遵循4.3.1章节推送规则的规范，如feat: #2 获取温度数据。
重复3-4步骤，直到功能开发完成。
向GitLab推送代码，在GitLab指定项目，如子项目A“代码——提交”可切换分支并查看不同分支的提交记录。

4.3.3 代码提交关联GitLab议题

在4.3.1和4.3.2章节中，除了要求代码提交应遵循一些统一格式外，还可以将代码提交与需求任务、Bug缺陷进行关联，实现需求管理和代码开发的双向追溯。将代码提交与GitLab议题关联，可参考以下步骤。操作步骤：

在代码提交时，只需将议题ID号写入提交记录中，如feat: #2 获取温度数据，其中#2就是需求“获取温度数据”的议题ID号。需注意代码提交仅能关联该代码所属项目（代码库）中的议题，不能关联其他项目（代码库）中的议题。
可以修改推送规则，如^(feat|fix|doc|style|refactor|test|revert|ci): #[0-9]{1,4}.*$，这样可强制研发人员每次提交代码时都填写对应的议题ID号。
代码提交追溯需求、缺陷：在代码提交记录中，点击议题ID号，则会跳转到对应的议题
需求、缺陷追溯代码提交：在议题中也可查看该议题关联的代码提交记录

4.3.4 代码提交关联第三方项目管理系统

如果您已经使用Jira、PingCode、Ones、LigaAI等国内外主流项目管理工具，极狐GitLab的代码提交也可以关联这些主流第三方系统的任务ID，实现双向追溯。目前已经支持的有：

以Jira为例，实现的效果如下：

可以修改推送规则，如^(feat|fix|doc|style|refactor|test|revert|ci): JIRA\-\d+ .+，其中JIRA是Jira议题的前缀，不同Jira项目的前缀不同，需要替换。这样可强制研发人员每次提交代码时都填写Jira的议题ID号。
代码提交追溯需求、缺陷：在代码提交记录中，点击议题ID号，则会跳转到对应的议题。
需求、缺陷追溯代码提交：在Jira议题中也可查看该议题关联的代码提交记录。
更多功能，请参见文档

4.4 持续集成、持续部署

代码推送到极狐GitLab后，应触发流水线实现自动化的编译、打包、部署。

4.4.1 配置流水线

自动编译、构建、打包、单元测试、质量扫描、部署、发布都依赖于流水线的配置和编排，只有先配置好流水线才能再后续的开发过程中实现上述功能。

为降低流程复杂度，请参考4.2章节，临时关闭main分支的保护，用来配置、调试流水线（调试结束后开启保护分支）。需注意实际项目中不推荐直接修改main分支文件，依然是通过feature分支配置、调试流水线，再合并到main分支。

4.4.1.1 环境变量管理

如果需要将打包后的程序直接上传/部署到其他环境里，需要将不同环境的服务器的信息存储到GitLab环境变量中，并且确保GitLab Runner所在的服务器与上传/部署的目标服务器网络互通。

在本示例中，我们计划通过scp命令将软件包上传到不同环境的服务器中，那么在GitLab里，存储的变量可以为

bash

# 生产环境的用户名、IP、PORT、路径
USERNAME_PROD: ubuntu
IP_PROD: 192.168.0.1
PORT_PROD: 22
PATH_PROD: /wwwroot/

# 测试环境的用户名、IP、PORT、路径
USERNAME_TEST: ubuntu
IP_TEST: 172.16.0.1
PORT_TEST: 22
PATH_TEST: /wwwroot/

操作步骤：

在子项目A的“设置——CICD——变量”中，添加上述变量。
为了防止这些变量在流水线中被echo命令打印出来导致信息泄露，可以在设置变量时勾选“隐藏变量”。
环境变量也可以设置在群组和实例级别，对群组和全局生效。

4.4.1.2 编译、打包、部署

进行这一步操作之前，需要根据不同语言、不同框架的代码项目，需要准备好编译服务器并安装好编译程序所需的环境，或准备好用于编译程序的Docker镜像。安装好GitLab Runner（如果您使用GitLab SaaS），然后参考以下内容基于GitLab CI关键字编写流水线脚本。

以一个C++的项目为例，通过指定的GitLab Runner完成自动编译、打包，根据流水线的触发条件来将软件包部署到指定的环境，如通过tag触发的流水线将软件包部署到生产环境（tag表示正式发版）同时将软件包上传到GitLab的制品库（软件包库），通过其他分支触发的流水线将软件包部署到测试环境。

操作步骤：

在子项目A的“构建——流水线编辑器”中，点击“配置流水线”。
流水线脚本内容如下：

yaml

stages:
  - build
  - upload
  - deploy

# 编译任务，使用docker类型Runner
build-job:
  stage: build
  # 编译环境镜像
  image: srzzumix/googletest
  script:
    # 编译打包
    - mkdir build
    - cd build
    - cmake ..
    - make
  artifacts:
    when: always
    paths:
      # 暂存打包程序，供upload-job使用
      - build/libsqrt.so

# 上传任务，使用docker类型Runner
upload-job:
  stage: upload
  image: alpine/curl
  rules:
    # 如果是从tag触发，即生产版本，则执行上传到制品库任务
    - if: '$CI_COMMIT_TAG  =~ /^v?\d+\.\d+\.\d+$/'
  script:
    # 上传到软件包库
    - 'curl --header "JOB-TOKEN: $CI_JOB_TOKEN" --upload-file ./build/libsqrt.so "${CI_API_V4_URL}/projects/${CI_PROJECT_ID}/packages/generic/release/$CI_COMMIT_TAG/libsqrt.so"'

# 部署任务，使用shell类型Runner
deploy-job:
  stage: deploy
  tags: 
    - deploy_jump_server 
  # 用分支名称区分环境
  environment: $CI_COMMIT_REF_NAME
  script:
  # 如果是从tag触发，使用生产环境变量，否则使用测试环境变量
    - |
      if echo "$CI_COMMIT_TAG" | grep -Eq '^v?[0-9]+\.[0-9]+\.[0-9]+$'; then
          USERNAME=$USERNAME_PROD
          IP=$IP_PROD
          PORT=$PORT_PROD
          PATH=$PATH_PROD
          echo '生产环境'
      else
          USERNAME=$USERNAME_TEST
          IP=$IP_TEST
          PORT=$PORT_TEST
          PATH=$PATH_TEST
          echo '测试环境'
      fi
    # 通过scp命令传输到对应环境
    #- scp -r ./build/libsqrt.so $USERNAME@$IP:@PATH -P $PORT
    - echo "Deployment Complete!"

需注意执行deploy-job的Runner需与部署环境网络互通，上述示例使用scp命令执行部署，还需参考以下方式配置该Runner到部署服务器的SSH Key：

可在子项目A的“构建——流水线”中查看流水线运行状态和结果。
如果部署任务成功执行，可以看到对应的软件包库已经上传/部署到目标环境（此处应是测试环境）的服务器中，如果部署失败，应结合deploy-job的日志进行排查。

4.4.1.3 单元测试

极狐GitLab支持与单元测试框架集成，不同语言、不同测试框架的集成方式见文档。以上文C++的代码项目为例

操作步骤：

使用GoogleTest作为单元测试框架。
编写测试脚本，如sqrt_test.cpp
修改.gitlab-ci.yml，增加以下内容

yaml

stages:
  - build
  - test # 增加test阶段
  - upload
  - deploy
  
# 编译任务
build-job:
  stage: build
  # 编译环境镜像
  image: srzzumix/googletest
  script:
    # 编译打包
    - mkdir build
    - cd build
    - cmake ..
    - make
    # 运行单元测试
    - ./sqrt_unittest --gtest_output="xml:report.xml"
    # 生成覆盖率
    - apt update
    - apt install -y pip
    - pip install gcovr --break-system-packages
    - gcovr --xml-pretty --exclude-unreachable-branches --print-summary -o coverage.xml --root ${CI_PROJECT_DIR}
  coverage: /^\s*lines:\s*\d+.\d+\%/
  artifacts:
    when: always
    paths:
      # 暂存打包程序，供upload-job使用
      - build/libsqrt.so
    reports:
      # 单测报告
      junit: build/report.xml
      # 单测覆盖率报告
      coverage_report:
        coverage_format: cobertura
        path: build/coverage.xml

如果配置正确，可在子项目A的“构建——流水线”中看到流水线的状态为成功。进入流水线，可看到单元测试的报告

4.4.1.4 质量扫描[专业版]

极狐GitLab支持开箱即用的代码质量扫描，使用该功能需要Docker或K8S类型的Runner，且Runner需开启Docker-in-Docker模式，以Docker类型的Runner为例：

进入Runner的Docker容器。
修改/etc/gitlab-runner/config.toml：

[[runners]]
  url = xxxx
  token = xxxx
  executor = "docker"
  [runners.docker]
    tls_verify = xxx
    image = xxx
    # 仅修改privileged为true
    privileged = true
    disable_cache = xxx
    volumes = xxx

配置好Runner后，可以开启代码质量扫描，以上文C++的代码项目为例：

操作步骤：

在子项目A代码库根目录创建文件.codeclimate.yml，内容如下：

yaml

plugins:
  cppcheck:
    enabled: true

修改.gitlab-ci.yml，增加以下内容:

yaml

include:
  - template: Jobs/Code-Quality.gitlab-ci.yml
  
code_quality:
    image: registry.gitlab.cn/gitlab-cn/docker:20.10.12
    services:
      - name: 'registry.gitlab.cn/gitlab-cn/docker:20.10.12-dind'
        command: ['--tls=false', '--host=tcp://0.0.0.0:2375']
        alias: docker
    variables:
      CODECLIMATE_PREFIX: "registry.gitlab.cn/"

3.如果配置正确，可在子项目A的“构建——流水线”中看到流水线的状态为成功。进入流水线，可看到质量扫描的报告

4.4.1.5 安全扫描[旗舰版]

极狐GitLab旗舰版内置SAST、SCA、DAST、密钥检测、模糊测试等7种类型的安全扫描工具，覆盖软件全生命周期，配置简单，开箱即用。使用该功能需要Docker或K8S类型的Runner。

在子项目A的“构建——流水线编辑器”中添加以下内容，以开启其中的4种静态安全扫描能力：

yaml

stages:
  - test

include:
  # 静态应用测试
  - template: Security/SAST.gitlab-ci.yml
  # 依赖扫描与许可证检测
  - template: Security/Dependency-Scanning.gitlab-ci.yml
  # 密钥检测
  - template: Security/Secret-Detection.gitlab-ci.yml

variables:
  # 安全扫描日志，有助于排查错误
  SECURE_LOG_LEVEL: debug

如果是扫描Maven项目，且需要自定义settings.xml文件，可参考4.4.1.1为该项目或群组创建环境变量，如名称为“MVN_SETTING”，类型为“文件”，内容为settings.xml文件中的内容

然后在流水线脚本中增加以下内容：

yaml

variables:
  # 安全扫描日志，有助于排查错误
  SECURE_LOG_LEVEL: debug
  # 使用自定义MVN Settings
  MAVEN_CLI_OPTS: "-s $MVN_SETTING"

如果配置正确，可在子项目A的“构建——流水线”中看到流水线的状态为成功。进入流水线，可看到安全扫描和许可证报告

4.4.1.6 安全策略[旗舰版]

您也可以参考文档，在群组级别设置安全扫描策略，该群组的所有项目将会强制执行这个安全扫描策略，可实现安全扫描的批量设置、强制执行，并且无需修改项目自身的流水线脚本，减少侵入性。

4.4.2 单元测试

操作步骤：

接着4.3.2分支开发的内容，在子项目A的feature/monitor-temperature分支增加一些单元测试的用例，用来体现差异。

c++

#include "sqrt.h"
#include "gtest/gtest.h"

TEST(SquareRootTest, PositiveNos) // normal cases
{ 
    ASSERT_EQ(6, squareRoot(36.0));
    ASSERT_EQ(18.0, squareRoot(324.0));
    ASSERT_EQ(25.4, squareRoot(645.16));
    ASSERT_EQ(0, squareRoot(0.0));
}

// 增加测试用例
TEST(SquareRootTest, NegativeNos) // extreme cases
{
    ASSERT_EQ(-1.0, squareRoot(-15.0));
    ASSERT_EQ(-1.0, squareRoot(-0.2));
}

int main(int argc, char **argv) 
{
    testing::GTEST_FLAG(output) = "xml:report.xml";
    testing::InitGoogleTest(&argc, argv);
    return RUN_ALL_TESTS();
}

提交代码后，自动触发feature/monitor-temperature分支的流水线，等流水线执行完成，可在流水线中查看单元测试报告。
也可在4.1.3或4.1.4章节中创建的feature/monitor-temperature到main的合并请求中查看单元测试报告以及单元测试覆盖率。

4.4.3 质量扫描[专业版]

操作步骤：

在子项目A的feature/monitor-temperature分支人为引入一些代码质量问题。

c++

#include "sqrt.h"
#include <iostream>
#include <cmath>
 
double squareRoot(const double a) 
{

    double b = sqrt(a);
    if(b != b) return -1.0;// NaN check
    else return sqrt(a);
}

// 人为引入代码质量问题
void decrease_code_quality() {
    // introduce an out-of-bounds error to check code quality report
    char a[10];
    a[10] = 0;

    return;
}

提交代码后，自动触发feature/monitor-temperature分支的流水线，等流水线执行完成，可在流水线中查看feature/monitor-temperature分支的全量代码质量报告。
也可在4.1.3或4.1.4章节中创建的feature/monitor-temperature到main的合并请求中查看feature/monitor-temperature分支新引入的代码质量报告。
如果您使用极狐GitLab旗舰版，还可以在合并请求的变更页面查看代码质量问题，详见文档。

4.4.3 质量扫描[专业版]

操作步骤：

在子项目A的feature/monitor-temperature分支人为引入一些代码质量问题。

c++

#include "sqrt.h"
#include <iostream>
#include <cmath>
 
double squareRoot(const double a) 
{

    double b = sqrt(a);
    if(b != b) return -1.0;// NaN check
    else return sqrt(a);
}

// 人为引入代码质量问题
void decrease_code_quality() {
    // introduce an out-of-bounds error to check code quality report
    char a[10];
    a[10] = 0;

    return;
}

提交代码后，自动触发feature/monitor-temperature分支的流水线，等流水线执行完成，可在流水线中查看feature/monitor-temperature分支的全量代码质量报告。
也可在4.1.3或4.1.4章节中创建的feature/monitor-temperature到main的合并请求中查看feature/monitor-temperature分支新引入的代码质量报告。
如果您使用极狐GitLab旗舰版，还可以在合并请求的变更页面查看代码质量问题。

4.4.4 安全扫描[旗舰版]

扫描报告可通过以下途径查看

漏洞报告：指定项目“安全——漏洞报告”，显示默认分支如main/master的全量漏洞报告：
依赖列表：指定项目“安全——依赖列表”，显示默认分支如main/master的全量依赖列表：
流水线安全报告：指定项目“流水线——安全/许可证”，显示当前分支的全量漏洞报告和许可证合规
合并请求安全报告：指定项目“合并请求——安全扫描/许可证”，显示源分支相较于目标分支的增量漏洞报告和许可证合规

4.4.5 代码评审

加速代码评审是提高软件交付效能最有效的途径之一。处于高效代码评审的团队，其软件交付效能有着50%的提升。 ——《2023 加速度 DevOps 全球状态报告》

如果您已参考4.1.3或4.1.4章节创建feature/monitor-temperature到main的合并请求，参考4.3章节推送了一些代码，参考4.4.1章节配置好流水线，那么此时您可以在合并请求中开展代码评审工作。极狐GitLab专业版提供以下几种评审机制，可以帮助企业更好的开展代码评审工作。

4.4.5.1 合并请求批准[专业版]

多人多规则、自定义的流程化审批机制。

操作步骤：

在指定项目，如子项目A的“设置——合并请求——合并请求批准”中，“添加批准规则”。
添加一个“规则名称”为测试组的规则，“目标分支”为所有受保护的分支，“需要核准”为1，“添加审核人”中选择需要参与评审的测试人员。这条规则意思是所有向main、release分支发起的合并请求，都需要指定的测试人员参与评审，其中只要有1个人通过评审，则这条规则就算通过。
添加一个“规则名称”为开发组的规则，“目标分支”为main，“需要核准”为1，“添加审核人”中选择需要参与评审的开发人员。这条规则意思是所有向main分支发起的合并请求，都需要指定的开发人员参与评审，其中只要有1个人通过评审，则这条规则就算通过。
考虑到代码提交人也可能是代码评审人，为了防止代码提交人自己给自己评审，可以：

勾选“阻止合并请求的创建者批准”。即如果评审人是合并请求的发起人，那么他不能参与评审。
勾选“阻止添加提交的用户批准”。即如果评审人是合并请求中代码的提交人，那么他不能参与评审。
选择“添加提交时：删除所有批准”。即评审过程中，如果有人评审通过，但开发人员提交了新的代码，则将所有通过的评审删除，应重新评审。

合并请求批准设置后仅对新发起的合并请求生效。为了验证效果，可以先将之前创建的合并请求删除，再重新创建从feature/monitor-temperature到main的合并请求，即可在合并请求中看到需要评审人批准后，才能进行后续的合并动作。

评审人可以点击“批准”或“撤销批准”，来决定评审是否通过。评审人给出通过意见后，“核准”列会显示数据变化，“已核准人”列会显示对应的评审人。

4.4.5.2 代码所有者CodeOwner[专业版]

针对不同的文件夹、文件类型、文件名称设置负责人。当这些文件内容发生变化时，自动将对应的负责人纳入合并请求的代码评审流程。

CodeOwner可以有效防止在协同开发的过程中，因为研发人员无意或有意修改他人的代码，但又未通知到相关人员，最终导致代码冲突、程序异常甚至引起一些生产事故的问题。

操作步骤：

在指定项目，如子项目A的默认分支，如main分支中创建名为CODEOWNERS的文件，或者通过feature分支创建文件然后合并到main分支。
CODEOWNERS文件的格式内容如下：

# 指定文件的负责人，@user1、@user2为GitLab的用户账号
file.md @user1
path/file.md @user1 @user2

# 指定文件类型的负责人
*.cpp @user1 @user2

# 指定文件路径的负责人
docs/ @user1
model/db/ @user2

# 将群组作为负责人，groupx、group-x/subgroup-y为群组路径
file.md @group-x @group-x/subgroup-y

在子项目A的“设置——仓库——受保护分支”中，开启需要代码所有者参与评审的分支
同合并请求批准一样，在合并请求中可以看到如果有人改了代码负责人的代码，那么这个负责人会被自动纳入代码评审流程。

4.4.5.3 单元测试覆盖率降低触发评审[专业版]

当合并请求的源分支（如feature/monitor-temperature）的单元测试覆盖率相较于目标分支（如main分支）降低时，触发评审。可以将代码的单元测试覆盖率始终维持在一个标准水平，从而提高代码的质量和可靠性。

操作步骤：

在子项目A的“设置——合并请求——合并请求批准”中启用覆盖率检查。
同合并请求批准一样，配置“目标分支”、“需要核准”、“添加核准人”。
同合并请求批准一样，新的规则只对新的合并请求生效，删除并重新创建合并请求后可以看到该规则已生效

4.4.5.4 安全门禁[旗舰版]

根据漏洞类型、级别、数量、状态设置安全门禁，当合并请求中安全扫描报告不符合安全门禁设置的要求时触发强制评审。可以帮助研发人员在开发阶段发现潜在的安全风险，并要求他们在代码合并前处理这些安全漏洞，或者通过安全负责人的审批后才允许合并。快速、多类型的安全扫描加上安全门禁可以帮助企业更好的落地安全左移。

操作步骤：

在子项目A的“安全——策略——新建策略——扫描结果策略”。
根据需求自定义安全门禁策略和审核人。
当合并请求中，源分支相较于目标分支的增量漏洞报告不满足安全门禁策略的要求，则无法进行代码合并，只有当开发人员解决相关漏洞问题，或通过审核人特批才能正常合并代码，从而实现安全卡点。

4.4.5.5 合并请求关闭GitLab议题

可以在合并请求中关联GitLab议题，当合并请求被执行合并后，该议题的状态自动变成关闭状态，即表示完成该议题。

操作步骤：

在指定的合并请求的描述中，添加Closes #1、Closes #4, #6这种关键字加议题ID的格式内容
合并请求执行合并后，对应的议题变成已关闭状态。

4.4.6 测试验证

如4.1.1所提到的，测试人员开展工作可能分为两个阶段：

4.4.6.1 功能测试

在单个任务开发阶段，即单个feature分支或单个fix分支开发完成后，需向main分支发起合并请求。在代码合并前，代码已部署到测试环境，测试人员可以在测试环境通过自动化工具或手动测试验证这个单一个功能是否正常，并参与这个功能的代码评审。若发现缺陷Bug，则可拒绝代码合并，同时给出意见反馈，开发人员重新提交代码进行修复；若功能都正常，则可在合并请求中给出通过批准，随后可执行代码合并。当一个里程碑的所有功能开发完成后，基于main分支创建release分支，并进入集成测试阶段。

操作步骤：

基于main分支创建release分支，如release/1.0.0。

4.4.6.2 集成测试

在集成测试阶段，基于main分支创建release分支，release分支包含了多个feature分支集成后的代码，从release分支触发代码构建，发布到测试环境进行集成测试。如果测试人员在这个阶段发现缺陷，那么可参考3.5.3提交缺陷议题，创建新的feature或fix分支来开发新功能或修复缺陷，再向main分支合并（功能测试阶段）。合并通过后使用cherry-pick拣选功能将这个合并请求拣选到release分支（集成测试阶段）。如果通过这个阶段的测试，则可以进入后续的交付、部署阶段。操作步骤：

在子项目A创建一个新的fix分支，如fix/tag-version-diff。
在fix/tag-version-diff分支下修改一些代码，模拟测试人员在集成测试中发现了一些缺陷，需要修复。
参考4.4.4章节，将fix/tag-version-diff合并到main分支。
在子项目A的“代码——提交”中，找到已从fix分支合并到main分支的代码提交，点击进入。
将该合并请求拣选到release/1.0.0分支。

4.4.7 交付、部署

4.4.7.1 测试环境交付

在集成测试阶段，也就是基于release分支触发流水线，可以看到：

在测试环境的服务器中，也能看到这个软件包被scp命令拷贝到了服务器中，这是deploy-job实现的功能。本示例仅在deploy-job中打印“测试环境”字符。

4.4.7.2 生产环境交付

集成测试通过，就可以准备发布正式版本。

操作步骤：

在子项目A“代码——标签”中新建标签（tag）。
填写“标签名称”，如1.0.1，“创建自”通过集成测试的release分支，即release/1.0.0分支
在生产环境的服务器中，也能看到这个软件包被scp命令拷贝到了服务器中，这是deploy-job实现的功能。本示例仅在deploy-job中打印“生产环境”字符。
在子项目A“部署——软件包库”中，已经有生产环境的安装包了，这是upload-job实现的功能。

5. 监控反馈

当软件已经完成交付、部署，那么就进入了运维阶段，企业可以结合自己的实际情况采用不同的监控手段来了解软件的运行情况。当软件发生故障时，运维人员、测试人员、开发人员再将问题进行定位，按照第3章节的步骤，创建新的需求或缺陷议题，并开始下一轮开发工作。

至此，极狐GitLab工作流已经完全跑通，并形成了闭环，感谢您的阅读。

名词解释

Sat, 13 Dec 2025 02:14:42 GMT

名词解释

main分支

只存线上的代码，只有确定可以上线时的才合并到main上，并且在main的基础上打Tag。

develop分支

初次创建develop时，需要从main分支拉取，保持开发时代码和线上最新的代码相同。develop分支是在开发时的最终分支，具有所有当前版本需要上线的所有功能。

feature分支

用于开发功能的分支，必须从最新的develop分支代码拉取。分支命名基本上是feature/xxxxx（和功能相关的名字或JIRA Ticket ID带描述）。

不强制提交到远程仓库，可以本地创建。比如，某开发人员开发登录功能，开发人员从develop分支的最新代码创建新分支命名为feature/login，然后切换到这个新分支开始开发。

开发完成后，测试差不多完成，合并到develop分支。

TODO: 只要有代码合并到develop就要出发自动化测试

release分支

当develop分支已经有了本次上线的所有代码的时候，并且以通过全部测试的时候，可以从develop分支创建release分支了，release分支是为发布新的产品版本而设计的。

通过在release分支上进行这些工作可以让develop分支空闲出来以接受新的feature分支上的代码提交，进入新的软件开发迭代周期。

在这个分支上的代码允许做小的缺陷修正、准备发布版本所需的各项说明信息（版本号、发布时间、编译时间等等）。

比如，此次1.0版本所有的功能版本都已经合并到了develop上，并且所有测试都已经通过了测试，那就创建新的release分支release/v1.0。切换到新分支，修改最新的版本号等，不允许大的更改。

hotfix分支

当线上出现bug需要紧急修复时，从当前main分支派生hotfix分支。

修改线上bug，修改完成后合并回develop和main分支。

比如，在线上v1.0登录功能出现问题，我从main拉取代码创建新的分支hotfix/v1.0_login，修改完成后合并到main和develop上。

tag

上线合并到main以后,保留版本历史记录,从main创建tag版本

分支生命周期

分支	说明	创建来源	代码来源	目标分支	代码输入方式	生命周期	命名规则
★ main	主干分支，通常作为代码基线，所有发布的代码最终都会合并到此分支。	无	release, hotfix	无	Pull request	长期	main
★ develop	开发分支，通常作为其他分支的源分支，也最终会合并回此分支	无	feature, release, hotfix	无	Pull request	长期	develop
feature	功能分支，用于为未来的应用版本开发新的功能需求	develop	develop	develop	Merge	并入目标分支后，可以删除	feature_
★ release	发布分支，用于辅助新版本发布的准备工作，例如小bug的修复，或者版本号的修改等等	develop	develop	develop, main	Merge	并入目标分支后，可以删除	release_
hotfix	修复分支，用于正式版本的紧急修复	main	main	develop, main, release	Merge	并入目标分支后，可以删除	hotfix_
tag	main发布版本快照	main	main	无	无	长期	tag_

场景说明

正常的业务需求流程

当接收到正常的业务需求时，需要约定一个大的发布版本（一次迭代）以及这个发布版本包含的多个jira任务，一个发布版本必须在一个时间点上发布；如果jira上的任务粒度太大，则需要拆分细化成更小的jira子任务（工作量在1~2人日为准，最好控制在一天以内）。

以develop为基准创建一个分支，分支名称为“feature-jira编号-开发人员姓名全拼”，如“feature-ONC-21-zhangsan”，jira任务ONC-21的所有开发工作都在feature-ONC-21-zhangsan，所有开发过程的commit message需要填写具体的开发内容。

开发及单元测试工作完成后创建merge request合并到develop分支，合并请求消息同样需要复制jira的内容描述以及具体的开发内容。

开发人员的自测工作基于合并后的develop分支代码进行，如果这个发布版本所有jira任务全部自测通过后，基于测试通过的develop分支创建一个release分支，分支名称为“release-版本号”，如“release-ctrip1.0”，测试人员基于release分支进行测试。

测试人员继续在新建的release分支上进行回归测试和验证，如果存在bug直接在该分支修改并合并到develop分支；如果验证通过则准备生产上线，

生产上线时将release代码合并到main分支，并打tag，tag名称为“tag-版本号”，从release打包上线。

紧急bug修复流程

当发现线上bug需要紧急修复时（开发人员需要确保bug修复已经在jira录入），需要以main分支为基准创建一个hotfix分支，分支名称为“hotfix-jira编号-开发人员姓名全拼”；

bug修复代码直接在新建的hotfix分支上提交，commit message需要填写具体的开发内容。测试人员直接在hotfix分支测试测试

通过后，开发人员同时请求合并到main分支,release分支,develop分支，合并请求消息同样需要复制jira的任务描述以及具体的开发内容。

生产上线时将hotfix代码合并到main分支，并打tag，tag名称为“tag-版本号-jira编号”，从release打包上线。

高优先级开发任务流程

如果在其他发布版本或迭代在开发中，而优先级更高的迭代需要同时进行，则需要特别注意。在创建feature分支时，要确保develop分支和main分支时一致的没有被未上线甚至未测试的代码污染过的，如果是则直接以develop分支为基准创建新的分支，命名规范如同正常的业务需求流程；如果develop分支上已经有其他未上线分支的代码且该分支代码上线优先级较低，则不能以develop分支为基准创建分支，需要以main分支为基准创建分支。

当更高优先级feature功能开发和自测完成后，需要上测试环境，这时，需要以main分支为基准创建一个release分支，release分支名称为“release-版本号”，所有较高优先级的feature分支合并到高优先级的release分支上，并在该分支进行测试。

release分支测试通过后，合并到main分支准备上生产，同时release合并到develop分支；main分支生产上线后打tag，tag名称为“tag-版本号”。

安装开源版Gitlab

Sat, 13 Dec 2025 02:14:42 GMT

安装开源版Gitlab

前提

先阅读文档

https://github.com/sameersbn/docker-gitlab

https://www.damagehead.com/docker-gitlab/

测试环境下最简单的方式是使用 docker-compose

准备下面的yaml文件，执行 docker-compose up

浏览器打开http：//localhost：10080并使用默认用户名和密码登录：

username: root
password: 5iveL!fe

docker-compose.yml

yaml

version: '2.3'

services:
  redis:
    restart: always
    image: redis:6.2
    command:
    - --loglevel warning
    volumes:
    - redis-data:/data:Z

  postgresql:
    restart: always
    image: sameersbn/postgresql:14-20230628
    volumes:
    - postgresql-data:/var/lib/postgresql:Z
    environment:
    - DB_USER=gitlab
    - DB_PASS=password
    - DB_NAME=gitlabhq_production
    - DB_EXTENSION=pg_trgm,btree_gist

  gitlab:
    restart: always
    image: sameersbn/gitlab:17.5.0
    depends_on:
    - redis
    - postgresql
    ports:
    - "10080:80"
    - "10022:22"
    volumes:
    - gitlab-data:/home/git/data:Z
    healthcheck:
      test: ["CMD", "/usr/local/sbin/healthcheck"]
      interval: 5m
      timeout: 10s
      retries: 3
      start_period: 5m
    environment:
    - DEBUG=false

    - DB_ADAPTER=postgresql
    - DB_HOST=postgresql
    - DB_PORT=5432
    - DB_USER=gitlab
    - DB_PASS=password
    - DB_NAME=gitlabhq_production

    - REDIS_HOST=redis
    - REDIS_PORT=6379

    - TZ=Asia/Shanghai
    - GITLAB_TIMEZONE=Shanghai

    - GITLAB_HTTPS=false
    - SSL_SELF_SIGNED=false

    - GITLAB_HOST=localhost
    - GITLAB_PORT=10080
    - GITLAB_SSH_PORT=10022
    - GITLAB_RELATIVE_URL_ROOT=
    - GITLAB_SECRETS_DB_KEY_BASE=long-and-random-alphanumeric-string
    - GITLAB_SECRETS_SECRET_KEY_BASE=long-and-random-alphanumeric-string
    - GITLAB_SECRETS_OTP_KEY_BASE=long-and-random-alphanumeric-string

    - GITLAB_ROOT_PASSWORD=
    - GITLAB_ROOT_EMAIL=

    - GITLAB_NOTIFY_ON_BROKEN_BUILDS=true
    - GITLAB_NOTIFY_PUSHER=false

    - [email protected]
    - [email protected]
    - [email protected]

    - GITLAB_BACKUP_SCHEDULE=daily
    - GITLAB_BACKUP_TIME=01:00

    - SMTP_ENABLED=false
    - SMTP_DOMAIN=www.example.com
    - SMTP_HOST=smtp.gmail.com
    - SMTP_PORT=587
    - [email protected]
    - SMTP_PASS=password
    - SMTP_STARTTLS=true
    - SMTP_AUTHENTICATION=login

    - IMAP_ENABLED=false
    - IMAP_HOST=imap.gmail.com
    - IMAP_PORT=993
    - [email protected]
    - IMAP_PASS=password
    - IMAP_SSL=true
    - IMAP_STARTTLS=false

    - OAUTH_ENABLED=false
    - OAUTH_AUTO_SIGN_IN_WITH_PROVIDER=
    - OAUTH_ALLOW_SSO=
    - OAUTH_BLOCK_AUTO_CREATED_USERS=true
    - OAUTH_AUTO_LINK_LDAP_USER=false
    - OAUTH_AUTO_LINK_SAML_USER=false
    - OAUTH_EXTERNAL_PROVIDERS=

    - OAUTH_CAS3_LABEL=cas3
    - OAUTH_CAS3_SERVER=
    - OAUTH_CAS3_DISABLE_SSL_VERIFICATION=false
    - OAUTH_CAS3_LOGIN_URL=/cas/login
    - OAUTH_CAS3_VALIDATE_URL=/cas/p3/serviceValidate
    - OAUTH_CAS3_LOGOUT_URL=/cas/logout

    - OAUTH_GOOGLE_API_KEY=
    - OAUTH_GOOGLE_APP_SECRET=
    - OAUTH_GOOGLE_RESTRICT_DOMAIN=

    - OAUTH_FACEBOOK_API_KEY=
    - OAUTH_FACEBOOK_APP_SECRET=

    - OAUTH_TWITTER_API_KEY=
    - OAUTH_TWITTER_APP_SECRET=

    - OAUTH_GITHUB_API_KEY=
    - OAUTH_GITHUB_APP_SECRET=
    - OAUTH_GITHUB_URL=
    - OAUTH_GITHUB_VERIFY_SSL=

    - OAUTH_GITLAB_API_KEY=
    - OAUTH_GITLAB_APP_SECRET=

    - OAUTH_BITBUCKET_API_KEY=
    - OAUTH_BITBUCKET_APP_SECRET=
    - OAUTH_BITBUCKET_URL=

    - OAUTH_SAML_ASSERTION_CONSUMER_SERVICE_URL=
    - OAUTH_SAML_IDP_CERT_FINGERPRINT=
    - OAUTH_SAML_IDP_SSO_TARGET_URL=
    - OAUTH_SAML_ISSUER=
    - OAUTH_SAML_LABEL="Our SAML Provider"
    - OAUTH_SAML_NAME_IDENTIFIER_FORMAT=urn:oasis:names:tc:SAML:2.0:nameid-format:transient
    - OAUTH_SAML_GROUPS_ATTRIBUTE=
    - OAUTH_SAML_EXTERNAL_GROUPS=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_EMAIL=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_NAME=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_USERNAME=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_FIRST_NAME=
    - OAUTH_SAML_ATTRIBUTE_STATEMENTS_LAST_NAME=

    - OAUTH_CROWD_SERVER_URL=
    - OAUTH_CROWD_APP_NAME=
    - OAUTH_CROWD_APP_PASSWORD=

    - OAUTH_AUTH0_CLIENT_ID=
    - OAUTH_AUTH0_CLIENT_SECRET=
    - OAUTH_AUTH0_DOMAIN=
    - OAUTH_AUTH0_SCOPE=
 
    - OAUTH_AZURE_API_KEY=
    - OAUTH_AZURE_API_SECRET=
    - OAUTH_AZURE_TENANT_ID=

volumes:
  redis-data:
  postgresql-data:
  gitlab-data:

生产建议

postgresql 和 redis 不要和 gitlab 运行在同一台服务器，最好使用独立数据库，避免单点故障

Live Expression

Sat, 13 Dec 2025 02:14:42 GMT

chrome浏览器是世界上最适合开发人员使用的浏览器的，没有之一。

Live Expression

从 chrome70起，我们可以在控制台上方可以放一个动态表达式，用于实时监控它的值。

点击 "Create Live Expression" 眼睛图标，打开动态表达式界面。

输入要监控的表达式，比如查看当前的时间戳，输入 Date.now()
会发现当前时间戳会一直变动。也就是表示式被重新计算了，Live Expression 的执行频率是250毫秒。

下面是一些有用的表达式：

document.activeElement 高亮当前focus的node
document.querySelector(s) 高亮任意node，参数s是css选择器表达式，相当于在hover这个node。
$0 高亮当前所选中的node
$0.parentElement 高亮当前所选中的node的父节点

Store DOM nodes as global variables

我们可以把页面上的某元素节点作为全局变量。

比如当前页面有一个按钮，我们审核该元素，右键选择 "store as global variable"

console面板中会显示该元素的引用名称，一般是 temp1 temp2。
在console中输入 monitorEvents(temp1) 会监视并打印出该元素的所有事件。
这个你可以在按钮上点击，移动，甚至按键，会发现一系列的mouse, click等事件
使用 unmonitorEvents(temp1) 停止记录事件。
使用 monitorEvents(temp1, ['mouse', 'focus']) 只记录某类型的事件。可以填 mouse, key, click, touch和control等。

参考：

https://developers.google.com/web/updates/2018/08/devtools https://developers.google.com/web/updates/2018/10/devtools#bonus https://developers.google.com/web/tools/chrome-devtools/console/command-line-reference

1. 截图

Sat, 13 Dec 2025 02:14:42 GMT

原文：https://developers.google.com/web/updates/2017/08/devtools-release-notes#await

1. 截图

以前截取网页我都用qq，直接ctrl+alt+a。现在chrome自带了截图功能，可以截取指定区域或者指定dom元素。

截取指定区域：按ctrl+shift+c, 然后按住鼠标左键不放，选取网页区域，最后松手会下载截图的图片。截取指定dom元素：右键检查元素，按ctrl+shift+P打开命令面板。输入"capture node"。然后回车，就会下载内容为指定元素的图片。

2. 新api

在console中，可以直接使用queryObjects查询特定的constructor

queryObjects(Promise). 返回所有的 Promises.
queryObjects(HTMLElement). 返回所有的 HTML elements.
queryObjects(foo), foo是函数名。返回所有实例化new foo()后的对象。

console

大部分人经常用 console.log() 使用 keys(console) 打印所有方法，keys 和 values 类似 Object.keys，Object.values 只在调试面板有用。

各个方法的详细用法请查看 https://developers.google.com/web/tools/chrome-devtools/console/utilities

$

看到$大家不要以为是jquery，其实是浏览器自带的一些api。这个在调试上就比较方便！

$:返回第一个符合条件的元素，相当于document.querySelector

$$:返回所有符合条件的元素，相当于document.querySelectorAll

查找和监控事件

getEventListeners作用就是查找并获取选定元素的事件。用法如下

monitorEvents作用是监控你所选元素关联的所有事件，事件触发时，在控制台打印它们。

getEventListeners和monitorEvents感觉在开发上用得并不多了，至少我没用过。但是感觉会有用，就提及一下

类似可以使用 monitor 来监控函数，每次调用该函数，就会打印出传入的参数。

var func1 = function(x, y, z) {
//....
};

输出：

参考：

14个你可能不知道的JavaScript调试技巧 https://developers.google.com/web/tools/chrome-devtools/console/utilities https://juejin.im/post/5d09c39ee51d4576bc1a0e07

查看网关的命令

Sat, 13 Dec 2025 02:14:42 GMT

查看网关的命令

ip route show
route -n
netstat -r

使用 NAT 网络

偏好设置 - 添加 NAT 网络

对每一个虚拟机进行网络设置，选择 NAT 网络

这样就可以让虚拟机访问外网了。

但是宿主机无法通过ssh访问虚拟机。

因为 NAT 中的虚拟机对于外部网络以及主机本身是不可见的

解决方式是使用端口转发

不用重启虚拟机可以直接测试

宿主机 ssh -p 22224 @127.0.0.1 可以访问虚拟机

宿主机浏览器访问 http://localhost:22225/ 可以看到nginx页面

ubuntu20.04 配置静态IP

sudo vi /etc/netplan/50-cloud-init.yaml
sudo netplan apply
sudo netplan --debug apply

yaml

network:
  ethernets:
    enp0s3:
        addresses: [192.168.1.2/24]
        gateway4: 192.168.1.1
        nameservers:
          addresses: [8.8.8.8,8.8.4.4]
        dhcp4: no
  version: 2

参考

我应该对虚拟机使用哪种网络模式

VMware虚拟机网络配置-NAT篇

代理工具准备

Sat, 13 Dec 2025 02:14:42 GMT

代理工具准备

Clash 等

以端口使用7890为例

安装浏览器代理插件

SwitchyOmega

配置终端代理

MacOS

iterm终端

bash

alias http_proxy="http_proxy=http://127.0.0.1:7890"
alias https_proxy="https_proxy=http://127.0.0.1:7890"
alias all_proxy="all_proxy=socks5://127.0.0.1:7890"
alias proxy_off="export https_proxy=;export http_proxy=;export all_proxy=;curl ipinfo.io;echo -e '\n终端代理已关闭'"
alias  proxy_on="export https_proxy=http://127.0.0.1:7890;export http_proxy=http://127.0.0.1:7890;export all_proxy=socks5://127.0.0.1:7890;curl ipinfo.io;echo -e '\n终端代理已开启'"
alias proxy_check="curl -I --connect-timeout 10 -w %{http_code}  https://facebook.com"
alias proxy_status="curl -I --connect-timeout 10 -w %{http_code}  https://facebook.com"
alias ip="curl cip.cc"

Git

配置拉取github仓库代码走代理

vi ~/.ssh/config

bash

Host github.com
    Hostname ssh.github.com
    Port 443
    ProxyCommand nc -v -x 127.0.0.1:7890 %h %p
    User git
    PreferredAuthentications publickey
    IdentityFile ~/.ssh/id_rsa

其他

排除 T3 打车 APP 的提示

Surge 及 Shadowrocket 在使用「 T3 出行」时遇到「检测到您正在使用网络代理，请关闭网络…」的，可以在文本编辑模式编辑，在 [General] 下的 skip-proxy 增加：passenger.t3go.cn 注意，passenger.t3go.cn 和原先内容之间要有英文逗号

Mac

Sat, 13 Dec 2025 02:14:42 GMT

推荐一些个人在使用的免费软件

Mac

Raycast：

https://raycast.com

直接替代掉原生的 Spotlight 搜索

OrbStack：

https://orbstack.dev

替换掉Docker 原生的应用，这个速度比亲儿子强太多了

Warp：

https://warp.dev 很现代的一个 terminal，iterm2的替代品

Kap

https://getkap.co/ 录制视频和 gif 的轻量工具

linear

https://linear.app/

项目管理

Trello

https://trello.com/

项目管理

文件

Cyberduck

文件查看器支持 FTP, SFTP, WebDAV, Amazon S3, OpenStack Swift, Backblaze B2, Microsoft Azure & OneDrive, Google Drive and Dropbox.

https://cyberduck.io/download/

OSSBrowser

专门查看阿里云OSS文件

https://help.aliyun.com/zh/oss/developer-reference/use-ossbrowser

PicGo

上传文件公有云对象存储服务，做为图床，我这个网站的图片都是存在了青云对象存储

https://github.com/Molunerfinn/PicGo

LocalSend

AirDrop的开源跨平台替代品如果你同时有安卓，苹果手机，平板等设备，需要同一局域网内相互传文件，可以使用这个软件

https://github.com/localsend/localsend

安全

Bitwarden

密码管理器, 支持多设备之间互相同步

https://bitwarden.com/download

Sat, 13 Dec 2025 02:14:42 GMT

storybook是一套最近比较火的响应式UI 开发及测试环境。可以可视化开发调试react，vue组件官网：https://github.com/storybooks/storybook 至于为什么叫storybook，猜测是敏捷开发中的user story有关，找了篇文章，不了解的同学可以看下

根据官网介绍一个story是一个或多个UI组件的单一状态，基本上像一个可视化测试用例。打开这个，这是airbnb公司实现的一个react的datepicker组件。这个组件配置很多，怎么让大家直观的查看学习呢？他就利用storybook写了很多story，左侧的每一项点开后是datepicker组件不同的状态或配置，就是一个个story。

storybook本身提供了很多组件，也可以添加自己的组件作为story，方便他人查看，使用并测试。

使用storybook你需要有react或vue的开发经验，并且熟悉es6。

下来带大家简单使用一下：

首先全局安装storybook命令： npm i -g @storybook/cli
来到一个已存在的react项目，可以是由creat-react-app创建的在根目录执行 getstorybook 命令会出现如下画面

发现这个命令实际修改了package.json，对比如下

然后又多出来个名为.storybook的目录，里面有附件组件文件 addons.js 和 config.js

安装后根据提示执行 yarn run storybook 启动storybook服务，浏览器打开 http://localhost:9009
这个页面是咋生成的呢，我们打开\src\stories\index.js一看便知

javascript

import React from 'react';

import { storiesOf } from '@storybook/react';
import { action } from '@storybook/addon-actions';
import { linkTo } from '@storybook/addon-links';

import { Button, Welcome } from '@storybook/react/demo';

// 文档 https://storybook.js.org/basics/writing-stories/
// storiesOf应该是分组，每组添加一个个story
// 修改内容页面会实时发生变化
storiesOf('Welcome', module).add('to Storybook', () => <Welcome showApp={linkTo('Button')} />);

// 使用action让storybook去记录log,可以在页面的action logger中查看
storiesOf('Button', module)
  .add('with text', () => <Button onClick={action('clicked')}>Hello Button</Button>)
  .add('with some emoji', () => <Button onClick={action('clicked')}>😀 😎 👍 💯</Button>);

今天就先研究到这里

Sat, 13 Dec 2025 02:14:42 GMT

prettier是一个专门格式化JavaScript代码的工具。 WebStorm 2018.1 及以上版本集成了prettier工具。

安装 npm install prettier --save-dev
创建配置文件 .prettierrc 放到项目根目录， prettier 的格式化风格内容比如是:

{
  "printWidth": 100,
  "singleQuote": true,
  "trailingComma": "es5"
}

commit 代码
按快捷键 Alt-Shift-Ctrl-P(macOS下是Alt-Shift-Cmd-P)，你会发现所有的双引号字符串都变成单引号了

在源码内关键字搜索

Sat, 13 Dec 2025 02:14:42 GMT

在源码内关键字搜索

首先打开Sources面板，然后按快捷键 Ctrl + Shift + F (Cmd + Opt + F). 输入关键字即可在全部资源文件中搜索，后面的选项支持大小写和正则

文件内快速跳转行号

打开一个源码文件后，输入 Ctrl + O (Cmd + O) 在输入如:200:10 回车，即可跳转到200行20列

切换颜色格式

按住shift键不放，左键颜色值的小方块，即可在RGBA，HSL和十六进制直接切换颜色格式

Preserve Log 保留日志

mafengwo-mp3-downloader

Sat, 13 Dec 2025 02:14:42 GMT

mafengwo-mp3-downloader

一款识别并下载马蜂窝游记页面背景mp3音乐的chrome扩展程序

主要功能

当打开游记页面比如如果检测到有背景音乐，会弹出包含歌曲信息的chrome桌面提醒，同时鼠标菜单右键有下载歌曲的选项。

安装

####源码

webstore下载

感谢

Sat, 13 Dec 2025 02:14:42 GMT

browserslist是一个开源项目见到有些package.json里会有如下的配置参数

 "browserslist": [
    "> 1%",
    "last 2 versions",
    "Android >= 3.2", 
    "Firefox >= 20", 
    "iOS 7"
  ]

应该不难猜出来，这代表这个项目的浏览器兼容情况。白话就是我这个项目兼容绝大多数的，最新的和iOS7系统下的浏览器。不兼容Android 3.2系统以下和Firefox20以下的浏览器像这些"> 1%", "last 2 versions" 都是查询参数。查询参数很强大，比如我想查看中国人使用浏览器的情况请输入 > 1% in CN。竟然还有IE8 ~>_<~。对比美国> 1% in US的。具体参数列表见官方文档

那配这个除了说明我的项目支持情况，对开发有啥作用呢?

具体的影响到前端工具的编译情况，比如 Autoprefixer 可以给css加兼容性前缀 babel-preset-env ， eslint-plugin-compat， stylelint-no-unsupported-browser-features 和 postcss-normalize 比如.babelrc文件你可以针对配置

{
  "presets": [
    ["env", {
      "targets": {
        "browsers": ["last 2 versions"],
        "node": "current"
      },
    }]
  ]
}

更进一步根据浏览器可以获得特性，比如最新的chrome浏览器支持原生的promise，而IE不支持，babel根据browserslist配置项就会动态的转义。不用在一个个进行配置了。

原理：

Sat, 13 Dec 2025 02:14:42 GMT

如果你正在使用mac电脑，并且经常需要在本地部署一些站点，又讨厌频繁的修改服务器配置文件重启服务器。强烈推荐使用Valet Valet是一套包含了Nginx和DnsMasq工具，配合PHP。可以快速的创建站点。

原理：

Valet 为您的 Mac 设置了开机后始终在后台运行 Nginx 服务。然后，Valet 使用 DnsMasq 将所有指向安装在本地的计算机站点请求代理到 *.test 结尾的域名上。

默认情况下，Valet 使用 .test 顶级域名为你的项目提供服务。例如，如果你要使用 .app 而不是 .test ，就运行 valet domain app ，Valet 会自动将站点域名改为 *.app 。

Valet 提供两个命令来为 Laravel 的站点提供服务：park 和 link 。

park 命令

mkdir ~/projects, cd ~/projects
执行 valet park
在projects目录中新建site1，然后再往site1放个index.php

浏览器打开http://site1.test 就能访问到

link 命令

可以针对某目录中提供单个站点而不是整个目录。

比如切换到 /projects/symfony-demo。默认可以通过http://symfony-demo.test 打开该站点。如果需要自定义，可以在该目录下执行 valet link my-symfony 会有提示 A [my-symfony] symbolic link has been created in [/Users/mafei/.config/valet/Sites/my-symfony].

然后就可以通过浏览器http://my-symfony.test 访问到了。不要忘了后缀。

支持Yii2项目

Valet 本身提供了很多开源项目，如Laravel，Lumen， Drupal，Wordpress等，但不支持Yii2项目。网上有现成的驱动实际就是告诉Valet项目的项目的根目录在哪。比如有一个Yii2的项目，绝对路径是~/sites/gee 来到~/sites/gee/frontend/web 这是Yii2项目默认的前台入口目录，执行 valet link gee 再来到~/sites/gee/backend/web 执行 valet link admin.gee 我们就可以通过http://gee.test打开前台，http://admin.gee.test打开后台

参考：

https://learnku.com/docs/laravel/5.6/valet/1356#the-park-command

注意事项

Sat, 13 Dec 2025 02:14:42 GMT

Postman是大家常用的API管理及测试工具。他可能比你想象中的更强大。个人最近研究了一波，简单总结一下。

Postman工具有chrome扩展和独立客户端，推荐安装独立客户端。
Postman有个workspace的概念，workspace 分 personal 和 team类型。 personal workspace 只能查看和管理自己的的API，team workspace 可添加成员和设置成员权限，成员之间可共同管理API。

每个workspace可管理多个collection，我们可以发布collection，即生成在线API文档。

collection及每个collection包含的API中的描述支持markdown
每个API支持写测试用例，下图 snippet 提供了很多测试示例

Postman提供了一个专门跑API测试的GUI工具，叫 Runner，配好循环次数，测试之间的时间间隔，然后针对某collection中的目录或上传collection就可以进行测试了。

Postman本身提供了一套Postman API可以操作collection，environment等，不过要先申请一个api_key。通过他可以以请求的方式操作自己写的API。
GUI工具需要我们手动点击触发跑测试，还无法做到完全自动化，好在Postman提供了CLI工具叫做 newman，是一个NodeJS项目。
下面的代码非常简单，配好要测试的collection和 environment，执行 node index.js 就能看到测试用例的结果。这里配置的是在命令行和html中显示报告。

这里我找了漂亮的 Postman Report Html模板

这样基本可以实现了 API测试自动化

注意事项

使用Postman要注意有配额限制，尤其是team workspace和调用API。超出后需要掏钱升级。team 中的 member 越多，收费越高。

不过免费的一般基本够用。 2. Postman的功能不止如此，还支持Fork, pull request，monitor监控等功能，大家可以查看官方文档。 3. 关于免费和收费版的区别

名词

Sat, 13 Dec 2025 02:14:42 GMT

https://www.keycloak.org/getting-started/getting-started-docker

本地快速练习

bash

docker run -p 8080:8080 -e KC_BOOTSTRAP_ADMIN_USERNAME=admin -e KC_BOOTSTRAP_ADMIN_PASSWORD=admin quay.io/keycloak/keycloak:26.0.7 start-dev

适用于测试环境

yaml

services:
  keycloak:
    image: quay.io/keycloak/keycloak:26.0.7
    container_name: keycloak
    environment:
      KC_BOOTSTRAP_ADMIN_USERNAME: ${KC_BOOTSTRAP_ADMIN_USERNAME:-admin}
      KC_BOOTSTRAP_ADMIN_PASSWORD: ${KC_BOOTSTRAP_ADMIN_PASSWORD:-password}
      KC_HOSTNAME: https://keycloak.mafeifan.com
      KC_PROXY: edge
      KC_PROXY_ADDRESS_FORWARDING: true # Crucial for correct protocol
      KC_HTTP_ENABLED: "true"
      KC_HOSTNAME_STRICT: "false"
      KC_HOSTNAME_STRICT_HTTPS: "false"
      KC_HTTP_HEADER_CONTENT_SECURITY_POLICY: "frame-src 'self' http://*.mafeifan.com https://*.mafeifan.com; object-src 'none';"
    command:
      - start-dev
    ports:
      - "8080:8080"
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8080/health/ready"]
      interval: 30s
      timeout: 10s
      retries: 3

nginx 配置

server {
    listen 80;
    server_name keycloak.mafeifan.com;
    return 301 https://$host$request_uri; # Redirect to HTTPS
}

server {
  listen 443 ssl http2;
  server_name keycloak.mafeifan.com;
  ssl_certificate /etc/nginx/my_certs/keycloak.mafeifan.com_bundle.crt;
  ssl_certificate_key /etc/nginx/my_certs/keycloak.mafeifan.com.key;
  ssl_session_timeout 5m;
  ssl_protocols TLSv1.2 TLSv1.3; # Modernize protocols
  ssl_ciphers TLS13-AES-256-GCM-SHA384:TLS13-CHACHA20-POLY1305-SHA256:TLS13-AES-128-GCM-SHA256:TLS13-AES-128-CCM-8-SHA256:TLS13-AES-128-CCM-SHA256; # Modernize ciphers
  ssl_prefer_server_ciphers on;

  location / {
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header Host $http_host;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header X-Forwarded-Proto $scheme;
    proxy_pass http://127.0.0.1:8080;
  }
}

名词

Realm：Keycloak中的一个 realm 领域相当于一个租户。
Clients：客户端是能够请求用户身份验证的应用和服务。

Keycloak中的一个 realm 领域相当于一个租户。每个 realm 允许管理员创建隔离的应用程序和用户组。最初，Keycloak包含一个名为 master 的单个 realm。仅使用此 realm 来管理Keycloak，不要用于管理任何应用程序。

使用[PicUploader](https://github.com/xiebruce/PicUploader)搭建个人图床

Sat, 13 Dec 2025 02:14:42 GMT

受这篇文章启发，总结下我用服务器都干了什么

使用PicUploader搭建个人图床

PicUploader 是一个用php编写的图床工具，它能帮助你快速上传你的图片到云图床，并自动返回Markdown格式链接到剪贴板。

但是我目前经使用客户端软件PicGo上传图片到青云了

使用frp搭建内网穿透工具

使用vuepress搭建个人博客

类似的工具很多，比如hexo, wordpress, Typora等

集成了如何测试？

Sat, 13 Dec 2025 02:14:42 GMT

Firebase Cloud Messaging (FCM) 是一种跨平台(安卓，IOS，Web)消息传递解决方案，且无需任何费用。

最近用cordova开发app，客户希望用firebase带的消息推送功能，国内我们知道有激光推送，leancloud，而国外firebase非常出名。

cordova使用firebase需要注意以下几点：

因为firebase已被google收购，国内手机设备无法接收来自firebase的推送，除非开代理，要打开的端口和主机名见官方文档
手机上的app运行状态分前台和后台
- 前台运行时可以接收到消息推送，但是不会有消息栏的提醒(这是手机的默认行为)，对于安卓，如果要在前台显示推送，推荐使用cordova-plugin-local-notification 插件
- 后台运行或关闭时，手机收到推送会显示消息栏，如果用户点击通知，app会显示在前台，通知内容会被JS回调接收。如果不点击或关闭，通知将一直存在。
我们项目中使用的是cordova-plugin-firebasex ，有个bug，手机息屏接收消息很快，亮屏app后台运行接收不稳定。
关于通知权限，对于安卓，不需要授权，但是对于apple，需要调用请求授权方法，如我们用到的cordova-plugin-firebasex插件需要调用提供的grantpermission方法。
使用安卓模拟器时记得选用带GooglePlay标志的版本，然后需要在更多设置里更新GooglePlay的版本，并在虚拟机内部做一下接入点代理，记得勾选一下梯子的允许来自局域网的访问。
FCM发送推送分三种类型：
- 按设备ID(针对性强，可以只发给某几台设备)，需要传device token
- 按topic主题，比如定义一个名为ad的topic，只有订阅这个topic的设备才能接收到通知
- 按target目标，这应该是firebase的特色，你可以针对某平台(ios或android),某个国家，某目标人群等统计相关参数发推送，很灵活。但是需要创建firebase创建项目时候开启google analysis
APN(Apple Push Notification)，不像安卓生态那么混乱，苹果生态中所有通知都走APN，大致流程：firebase通知APN，APN通知apple设备客户端。技术文档， firebase连APN需要我们在apple后台生成验权文件，就是P8或P12，后面会讲。
对于安卓，确保在firebase项目设置中生成了google-services.json文件，对于ios，要生成GoogleService-Info.plist文件，生成文件在放到cordova项目根目录，对于ios，还需要到苹果开发者后后台生成p8或p12文件并上传到firebase项目ios集成页面中

强烈建议生成P8认证文件，P12文件有很多缺点: 流程繁琐，区分开发和正式环境，还有有效期。P8和P12文件生成流程参见:iOS 推送设置指南

消息推送内容可以带emoji

集成了如何测试？

如果是用的Cordova集成消息推送，建议先运行这个插件的demo项目安卓手机模拟器可以收到推送消息，苹果的必须真机，收到推送消息的前提的运行获取FCM ID和FCM token成功(记得开代理，或者保证能访问google)

如何使用命令行发送消息

可以直接用curl命令调用https://fcm.googleapis.com/v1/projects/${project-id}/messages:send发送消息 ${project-id} 替换成firebase中project setting页面中生成的

bash

curl -X POST -H "Authorization: Bearer ya29.ElqKBGN2Ri_Uz...HnS_uNreA" -H "Content-Type: application/json" -d '{
  "message": {
    "topic" : "my-topic",
    "notification": {
      "body": "This is a Firebase Cloud Messaging Topic Message!",
      "title": "FCM Message"
    }
  }
}' https://fcm.googleapis.com/v1/projects/myproject-b5ae1/messages:send HTTP/1.1

参考

https://juejin.cn/post/6844904153274155022

https://github.com/katzer/cordova-plugin-local-notifications#readme

https://www.npmjs.com/package/cordova-plugin-fcm-with-dependecy-updated

https://developer.apple.com/documentation/usernotifications

创建新站点

Sat, 13 Dec 2025 02:14:42 GMT

创建新站点

安装完nginx，会有sites-available和sites-enabled目录，只有在sites-enabled目录下创建的站点配置文件才会生效，但是我们一般在sites-available目录下站点配置文件，然后软链接到sites-enabled，这样有个好处是假设下面的 www.booking.com 站点不需要了，只需要删掉sites-enabled/www.booking.com文件即可，他只是链接文件，源文件还是在sites-available目录下面，方便还原。

basic认证

有些网站页面需要输入正确的用户名和密码才能打开

实现方法也比较简单

sudo apt-get install apache2-utils
cd /etc/nginx
# 使用htpasswd命令创建用户demo,密码123456文件名htpasswd的验证文件
sudo htpasswd -bc htpasswd demo 123456
# 编辑 nginx 站点配置文件
# 加入下面两行到 server 或 location 段中
auth_basic 'Restricted';  # 认证名称，随意填写 
auth_basic_user_file /usr/local/nginx/htpasswd; # 认证的密码文件，需要生成。
# 重启 nginx
sudo nginx -t && sudo nginx -s reload

显示目录文件列表

场景：有个存放每日备份数据库或日志的目录，希望显示列表，方便下载文件

location / {
   root /data/www/file                   //指定实际目录绝对路径；
   autoindex on;                         //开启目录浏览功能；
   autoindex_exact_size off;             //关闭详细文件大小统计，让文件大小显示MB，GB单位，默认为b；
   autoindex_localtime on;              //开启以服务器本地时区显示文件修改日期！
   charset utf-8,gbk;                   //避免中文乱码
}

另外，如果希望请求文件是下载而不是显示内容，可以通过添加下面参数实现： add_header Content-Disposition attachment;

反向代理

我们只需要记得正向代理代理的对象是客户端，最常见的就是VPN软件

反向代理代理的对象是服务端

客户端本来可以直接通过HTTP协议访问某网站应用服务器，如果网站管理员在中间加上一个Nginx，客户端请求Nginx，Nginx请求应用服务器，然后将结果返回给客户端，此时Nginx就是反向代理服务器。

例子：Nginx监听来自外部访问80的请求，转发给自己服务器占用18083端口的服务

server {
    listen 80;
    index index.html index.htm index.nginx-debian.html;
    server_name mqtt.demo.com;
    location / {
      proxy_pass  http://127.0.0.1:18083;
    }
}

关于 try_files 指令

location / {
    # First attempt to serve request as file, then
    # as directory, then fall back to displaying a 404.
    # $uri 是变量 如 www.xxx.com/aaa.php 则 $uri是aaa.php
    # 假设我们访问/a.php 先判断 a.php是不是文件,是返回
    # 如果不是再判断是不是目录（$uri/）,是返回
    # 如果都不是则返回404
    try_files $uri $uri/ =404;
}
#  所有的请求引导到index.php中
try_files $uri $uri/   /index.php?$query_string  =404;

@ 符号的使用

@用于定义一个 location 块，且该块不能被外部 Client 所访问，只能被 Nginx 内部配置指令所访问，比如 try_files

c49fb81c8f9141ae3fe7f9db2da60bd7.htm 实际上个不存在的文件，下面的含义的如果访问项目根目录或blog目录底下的以php结尾的文件都走php fpm解析流程

location ~ \.php$ {
    try_files /c49fb81c8f9141ae3fe7f9db2da60bd7.htm @php;
}
location /blog/\.php$ {
    try_files /c49fb81c8f9141ae3fe7f9db2da60bd7.htm @php;
}
location @php {
    try_files $uri =404;
    include /etc/nginx/fastcgi_params;
    fastcgi_pass unix:/var/lib/php7.2-fpm/web10.sock;
    fastcgi_index index.php;
    fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
    fastcgi_intercept_errors on;
}

使用Nginx解决跨域问题

当公司存在多个域名时，两个不同的域名相互访问就会存在跨域问题。

或者在进行前端开发时，通常前端代码在本地启动，而后端代码会部署在一台专用的后端开发服务器上，此时前端去调用后端接口时，就会出现跨域问题。

解决跨域的方法有很多，今天来说一下如何使用Nginx来解决跨域问题。

假设后端服务器，是使用Nginx作为对外统一入口的，在Nginx配置文件的server块中增加如下配置：

# 允许跨域请求的域名，*代表所有
add_header 'Access-Control-Allow-Origin' *;
# 允许带上cookie请求
add_header 'Access-Control-Allow-Credentials' 'true';
# 允许请求的方法，例如：GET、POST、PUT、DELETE等，*代表所有
add_header 'Access-Control-Allow-Methods' *;
# 允许请求的头信息，例如：DNT,X-Mx-ReqToken,Keep-Alive,User-Agent等，*代表所有
add_header 'Access-Control-Allow-Headers' *;

重新加载Nginx，便发现，已经可以跨域访问了。

验证头信息中的 referer 参数

请求头信息中的 referer 参数，记录了上一个页面的地址，Nginx可以对其进行校验，达到防盗链的目的。

通常在配置文件的location块中增加配置。

server {
    listen       80;   # 端口
    server_name  www.osvlabs.com;  # 服务名，可以是IP地址或者域名

    location / {   # 根路径
　　　　　root   html;  # 对应nginx安装目标下的html文件夹
        index  hello.html; # 指定首页为 hello.html
    }

    location ~* \.(GIF|PNG|jpg|bmp|jpeg) {  # *代表不区分大小写
        # 校验请求是否来自于osvlabs.com这个站点，不是则返回404页面
    　　valid_referers *.osvlabs.com;
    　　if ($invalid_referer) {
           return 404;
    　　}
　　　　 root /home/img;
　　}

    error_page 500 502 503 504  /50x.html;  # 指定这些状态码跳转的错误页
    location = /50x.html {
        root   html;
    }
}

Nginx构建Tomcat集群

Nginx最常用的一个功能，就是为Tomcat构建集群，以达到实现高并发、高可用的目的。

首先在 upstream 块中，配置Tomcat集群中的服务地址，然后在location块中配置转发请求到此 upstream。

# 配置Tomcat集群中的服务器
upstream osvlabs {
    server 192.168.1.101:8080;
    server 192.168.1.102:8080;
    server 192.168.1.103:8080;
}

server {
    listen  80;
    server_name     www.osvlabs.com;

    location / {
        proxy_pass      http://osvlabs;
    }
}

默认按所有机器权重为1的轮询方式对集群服务进行访问，每个服务访问1次，然后访问下一个服务，适合集群中每台服务器性能差不多的情况。

权重配置也是经常用的，适用于机器性能有差异的情况。

upstream osvlabs {
　　server 192.168.1.101:8080  weight=1;
　　server 192.168.1.102:8080;
　　server 192.168.1.103:8080  weight=3;
}

weight 就是权重配置，不配默认是1，按照以上配置，在5次请求中，101和102会被访问1次，103会被访问3次。

使用down，可以标识某个服务已停用，Nginx便不会去访问他了。

upstream osvlabs {
    server 192.168.1.101:8080;
    server 192.168.1.102:8080 down;
    server 192.168.1.103:8080;
}

使用backup，可以标识101是备用机，当102、103宕机后，101会进行服务。

upstream osvlabs {
    server 192.168.1.101:8080 backup;
    server 192.168.1.102:8080;
    server 192.168.1.103:8080;
}

使用 max_fails 和 fail_timeout 将服务动态停用

max_fails 默认是1，fail_timeout默认是10s

upstream osvlabs {
    server 192.168.1.101:8080 max_fails=2 fail_timeout=10s;
    server 192.168.1.102:8080;
    server 192.168.1.103:8080;
}

如此配置，101服务器在10秒内如果失败次数达到2次，会停用10秒。10秒后，会尝试连接101服务器，如果连接成功则恢复轮询方式，如果不成功，再等待10秒尝试。

使用keepalive设置长链接数量，提高吞吐量

upstream osvlabs {
    server 192.168.1.101:8080;
    server 192.168.1.102:8080;
    server 192.168.1.103:8080;
    
    keepalive 50;
}

 server {
    listen  80;
    server_name     www.osvlabs.com;

    location / {
        proxy_pass      http://osvlabs;
        
        proxy_http_version    1.1;
        proxy_set_header    Connection "";
    }
}

需要在upstream块中增加 keepalive 配置，在server的location块中增加 proxy_http_version 和 proxy_set_header 配置。

这样设置可以减少连接断开、新建的损耗，增加吞吐量。

其他负载均衡策略

除了前面说到的轮询方式，Nginx在负载均衡时，还有其他策略。

ip_hash：以客户端IP地址为依据，匹配服务器。
hash $request_uri：以请求的URL为依据，匹配服务器。
least_conn：以服务器连接数为依据，哪个服务器连接数少，匹配哪台服务器

upstream osvlabs {
    # ip_hash;
    # hash $request_uri;
    least_conn;

    server 192.168.1.101:8080;
    server 192.168.1.102:8080;
    server 192.168.1.103:8080;
}

access_log过滤

一个网站，会包含很多元素，尤其是有大量的图片、js、css等静态元素。这样的请求其实可以不用记录日志。

location ~* ^.+\.(gif|jpg|png|css|js)$ 
{
    access_log off;
}

或
location ~* ^.+\.(gif|jpg|png|css|js)$                                      
{
    access_log /dev/null;
}

前提

Sat, 13 Dec 2025 02:14:42 GMT

youtube上有些视频还是不错的，比如我关注的小马技术，还开通了三级会员，我想把他讲的不错的列表视频下载下来保存。

github上面找到了这个不错的工具yt-dlp

他是基于大名鼎鼎的youtube-dl又额外添加了些功能。

前提

本地安装并开启代理,比如Clash,暴露代理地址,比如socks5://127.0.0.1:7890

会自动当列表下载

yt-dlp https://www.youtube.com/watch?v=MXdFMjm3vTs&list=PLliocbKHJNwslcXWGhQ7oaQSmw-MzLaXu&index=2 --proxy socks5://127.0.0.1:7890

先加--simulate尝试下载

yt-dlp --simulate https://www.youtube.com/watch?v=MXdFMjm3vTs --cookies-from-browser edge --proxy socks5://127.0.0.1:7890

下载付费课程

前提你可以正常播放该视频

yt-dlp https://www.youtube.com/watch?v=MXdFMjm3vTs --cookies-from-browser chrome --proxy socks5://127.0.0.1:7890

追加播放列表序号

yt-dlp --verbose -o "%(playlist)s/%(playlist_index)s - %(title)s.%(ext)s" "https://www.youtube.com/playlist?list=PLliocbKHJNwvBSh4DeBDHgq_8xINNzrt4" --cookies-from-browser chrome --proxy socks5://127.0.0.1:7890 --extractor-args youtubetab:skip=authcheck

准备

Sat, 13 Dec 2025 02:14:42 GMT

之前分享过一个 ngrok内网穿透工具，这个不是开源的，再推荐一个国人开发的免费开源工具 frp，配置项更多，功能更强大。不过需要你有一台公网IP的服务器，如果要访问内网的web服务，还需要一个域名。

准备

公网服务器，假设系统 Linux Ubuntu, 公网IP 140.140.192.192，绑定了域名 www.good.com
本机 Mac 系统，跑着一个Angular程序，在本地访问，地址是 localhost:4200

效果

利用frp，可以实现任何人都可以通过配置的端口如 www.good.com:7001 访问我本机的Angular程序

方法

服务器和内网本机分别下载对应系统平台的frp，这里ubuntu服务器需要下载linux_arm_64， mac本机是darwin_amd64。
先配服务端，在服务器上下载解压，编辑 frps.ini，然后启动 ./frps -c ./frps.ini 后台启动命令 nohup ./frps -c ./frps.ini &

[common]
bind_port = 7000
# 客户端定义的端口
vhost_http_port = 7001

配置客户端，同样下载解压

wget https://github.com/fatedier/frp/releases/download/v0.23.1/frp_0.23.1_darwin_amd64.tar.gz
tar -zxvf  frp_0.23.1_darwin_amd64.tar.gz

编辑 frpc.ini

[common]
server_addr = 140.140.192.192   #公网服务器ip
server_port = 7001                       #与服务端bind_port一致
 
#公网访问内部web服务器以http方式
[web]
type = http         #访问协议
local_port = 4200   #内网web服务的端口号
custom_domains = www.good.com   #所绑定的公网服务器域名，一级、二级域名都可以

浏览器打开 www.good.com:4300 测试

进阶

修改服务端的 frps.ini，添加 dashboard 信息，重启启动后可以通过140.140.192.192:7500打开控制面板

[common]
bind_port = 7000
# 客户端定义的端口
vhost_http_port = 7001

dashboard_port = 7500
# dashboard 用户名密码，默认都为 admin
dashboard_user = admin
dashboard_pwd = admin

注意事项

报 Invalid Host header

如果本机的web项目用了webpack server(目前vue cli, react cli, angular 本地开发用的都是这个) 这个是webpack server的安全策略，如果是angular项目，需要在启动配置中加上 --disable-host-check 类似 ng serve --open --host $IP --port $PORT --disable-host-check

参考

https://blog.csdn.net/u013144287/article/details/78589643/

Sat, 13 Dec 2025 02:14:42 GMT

需求：

自己做的网站系统需要一个公网地址，方便给客户演示，传统做法是买个有公网地址的服务器，可是手头上又没有服务器。即便有服务器还要搭建环境，同步代码啥的，非常不方便。关键只是演示，没必要大动干戈。
微信开发或聊天机器人开发等需要填写域名，比如微信窗口里打开IP地址会有警告提示，测试起来很麻烦。手头没有域名或者没有必要。

这时可以使用ngrok工具。他可以分配给你一个公网的二级域名，来绑定你本地的正在跑的http服务。比如我本地跑了一个vue cli搭建的程序，跑起来后默认是 http://localhost:8080 。当我安装 ngnok 后，执行 ./ngrok http 8080 (Windows系统下可能是ngrok.exe)

如图：工具随机分配给我了http和https两个地址，这个时候无论是手机还是电脑，还是其他地方的小伙伴访问 http://100a13a1.ngrok.io 就可以看到我本机上的 localhost:8080 打开web interface对应的地址，可以看到请求和响应内容，方便调试。

具体地址： https://ngrok.com/

注意：

对于免费用户，每次启动ngrok分配到的公网地址是会变的。可以用国内的类似的服务，他提供了固定而且免费的地址。不过访问速度有点慢。毕竟是免费的。 https://ngrok.cc/
当页面显示Invalid Host header，因为vue cli使用的是webpack server，基于安全对访问做了限制。在 build/webpack.dev.conf.js 内

//追加配置
devServer: {
    host: '0.0.0.0',
    disableHostCheck: true
  }

我的博客即将搬运同步至腾讯云+社区，邀请大家一同入驻：https://cloud.tencent.com/developer/support-plan?invite_code=v7er73kcqd35

示例页面

Sat, 13 Dec 2025 02:14:42 GMT

默认主题

左对齐	右对齐	居中对齐
单元格	单元格	单元格
单元格	单元格	单元格

🎉 💯

TIP

This is a tip

WARNING

This is a warning

DANGER

This is a dangerous warning

STOP

Danger zone, do not proceed

点击查看代码

一、各系统组件选型

Sat, 13 Dec 2025 02:14:42 GMT

这篇文章质量不错，转来学习，顺便做些个人说明和补充原文：http://www.phppan.com/

说到后台技术栈，脑海中是不是浮现的是这样一幅图？

有点眼晕，以上只是我们会用到的一些语言的合集，而且只是语言层面的一部分，就整个后台技术栈来说，这只是一个开始，从语言开始，还有很多很多的内容。今天要说的后台是大后台的概念，放在服务器上的东西都属于后台的东西，比如使用的框架，语言，数据库，服务，操作系统等等，整个后台技术栈我的理解包括4个层面的内容：

语言：用了哪些开发语言，如：c++/java/go/php/python/ruby等等；
组件：用了哪些组件，如：MQ组件，数据库组件等等；
流程：怎样的流程和规范，如：开发流程，项目流程，发布流程，监控告警流程，代码规范等等；
系统：系统化建设，上面的流程需要有系统来保证，如：规范发布流程的发布系统，代码管理系统等等；结合以上的的4个层面的内容，整个后台技术栈的结构如图2所示：

以上的这些内容都需要我们从零开始搭建，在创业公司，没有大公司那些完善的基础设施，需要我们从开源界，从云服务商甚至有些需要自己去组合，去拼装，去开发一个适合自己的组件或系统以达成我们的目标。咱们一个个系统和组件的做选型，最终形成我们的后台技术栈。

一、各系统组件选型

1、项目管理/Bug管理/问题管理

项目管理软件是整个业务的需求，问题，流程等等的集中地，大家的跨部门沟通协同大多依赖于项目管理工具。有一些 SAAS 的项目管理服务可以使用，但是很多时间不满足需求，此时我们可以选择一些开源的项目，这些项目本身有一定的定制能力，有丰富的插件可以使用，一般的创业公司需求基本上都能得到满足，常用的项目如下：

Redmine：用 Ruby 开发的，有较多的插件可以使用，能自定义字段，集成了项目管理，BUG 问题跟踪，WIKI 等功能，不过好多插件 N 年没有更新了;
Phabricator: 用 PHP 开发的，facebook 之前的内部工具，开发这工具的哥们离职后自己搞了一个公司专门做这个软件，集成了代码托管， Code Review，任务管理，文档管理，问题跟踪等功能，强烈推荐较敏捷的团队使用；
Jira：用 Java 开发的，有用户故事，task 拆分，燃尽图等等，可以做项目管理，也可以应用于跨部门沟通场景，较强大；
悟空CRM ：这个不是项目管理，这个是客户管理，之所以在这里提出来，是因为在 To B 的创业公司里面，往往是以客户为核心来做事情的，可以将项目管理和问题跟进的在悟空 CRM 上面来做，他的开源版本已经基本实现了 CR< 的核心功能，还带有一个任务管理功能，用于问题跟进，不过用这个的话，还是需要另一个项目管理的软件协助，顺便说一嘴，这个系统的代码写得很难维护，只能适用于客户规模小（1万以内）时。

个人补充：现在Jira分Cloud云端版和安装版，前者就是在线版，Jira会为你提供一个二级域名，省去了买服务器，维护数据库等运维成本，不过要每月付费，这也是以后的趋势。即服务及软件。安装版就是在自己服务器上安装Jira JAVA程序包，网上有7.x破解版本的。已经够用，不过服务器配置低的话会比较卡。另外 Jira 的社区也比较强大，支持插件扩展，有些很强大比如 Zephyr for Jira - Test Management 测试用例管理，tempo-timesheets 统计工作量，报表，财务，插件也是要每月付费的。 Jira 提供的定制化功能超强，比如 issue type， work flow， fields 都可以自己配，个人感觉安装版基本够用。

2、DNS

DNS 是一个很通用的服务，创业公司基本上选择一个合适的云厂商就行了，国内主要是两家：

阿里万网：阿里 2014 年收购了万网，整合了其域名服务，最终形成了现在的阿里万网，其中就包含 DNS 这块的服务；
腾讯 DNSPod: 腾讯 2012 年以 4000 万收购 DNSPod 100% 股份，主要提供域名解析和一些防护功能；如果你的业务是在国内，主要就是这两家，选一个就好，像今日头条这样的企业用的也是 DNSPod 的服务，除非一些特殊的原因才需要自建，比如一些 CDN 厂商，或者对区域有特殊限制的。要实惠一点用阿里最便宜的基础版就好了，要成功率高一些，还是用DNSPod 的贵的那种。

在国外还是选择亚马逊吧，阿里的 DNS 服务只有在日本和美国有节点，东南亚最近才开始部点， DNSPod 也只有美国和日本，像一些出海的企业，其选择的云服务基本都是亚马逊。

如果是线上产品，DNS 强烈建议用付费版，阿里的那几十块钱的付费版基本可以满足需求。如果还需要一些按省份或按区域调试的逻辑，则需要加钱，一年也就几百块，省钱省力。

如果是国外，优先选择亚马逊，如果需要国内外互通并且有自己的 APP 的话，建议还是自己实现一些容灾逻辑或者智能调度，因为没有一个现成的 DNS 服务能同时较好的满足国内外场景，或者用多个域名，不同的域名走不同的 DNS 。

3、LB(负载均衡)

LB(负载均衡)是一个通用服务，一般云厂商的 LB 服务基本都会如下功能：

支持四层协议请求（包括 TCP、UDP 协议）;
支持七层协议请求（包括 HTTP、HTTPS 协议）;
集中化的证书管理系统支持 HTTPS 协议;
健康检查;

如果你线上的服务机器都是用的云服务，并且是在同一个云服务商的话，可以直接使用云服务商提供的 LB 服务，如阿里云的 SLB，腾讯云的 CLB，亚马逊的 ELB 等等。如果是自建机房基本都是 LVS + Nginx。

4、CDN

CDN 现在已经是一个很红很红的市场，基本上只能挣一些辛苦钱，都是贴着成本在卖。国内以网宿为龙头，他们家占据整个国内市场份额的40%以上，后面就是腾讯，阿里。网宿有很大一部分是因为直播的兴起而崛起。

国外，Amazon 和 Akamai 合起来占比大概在 50%，曾经的国际市场老大 Akamai 拥有全球超一半的份额，在 Amazon CDN入局后，份额跌去了将近 20%，众多中小企业都转向后者，Akamai 也是无能为力。

国内出海的 CDN 厂商，更多的是为国内的出海企业服务，三家大一点的 CDN 服务商里面也就网宿的节点多一些，但是也多不了多少。阿里和腾讯还处于前期阶段，仅少部分国家有节点。

就创业公司来说，CDN 用腾讯云或阿里云即可，其相关系统较完善，能轻松接入，网宿在系统支持层面相对较弱一些，而且还贵一些。并且，当流量上来后，CDN 不能只用一家，需要用多家，不同的 CDN 在全国的节点覆盖不一样，而且针对不同的客户云厂商内部有些区分客户集群，并不是全节点覆盖（但有些云厂商说自己是全网节点），除了节点覆盖的问题，多 CDN 也在一定程度上起到容灾的作用。

5、RPC框架

维基百科对 RPC 的定义是：远程过程调用（Remote Procedure Call，RPC）是一个计算机通信协议。该协议允许运行于一台计算机的程序调用另一台计算机的子程序，而程序员无需额外地为这个交互作用编程。

通俗来讲，一个完整的RPC调用过程，就是 Server 端实现了一个函数，客户端使用 RPC 框架提供的接口，调用这个函数的实现，并获取返回值的过程。

业界 RPC 框架大致分为两大流派，一种侧重跨语言调用，另一种是偏重服务治理。

跨语言调用型的 RPC 框架有 Thrift、gRPC、Hessian、Hprose 等。这类 RPC 框架侧重于服务的跨语言调用，能够支持大部分的语言进行语言无关的调用，非常适合多语言调用场景。但这类框架没有服务发现相关机制，实际使用时需要代理层进行请求转发和负载均衡策略控制。

其中，gRPC 是 Google 开发的高性能、通用的开源 RPC 框架，其由 Google 主要面向移动应用开发并基于 HTTP/2 协议标准而设计，基于 ProtoBuf(Protocol Buffers) 序列化协议开发，且支持众多开发语言。本身它不是分布式的，所以要实现框架的功能需要进一步的开发。

Hprose(High Performance Remote Object Service Engine) 是一个 MIT 开源许可的新型轻量级跨语言跨平台的面向对象的高性能远程动态通讯中间件。

服务治理型的 RPC 框架的特点是功能丰富，提供高性能的远程调用、服务发现及服务治理能力，适用于大型服务的服务解耦及服务治理，对于特定语言(Java)的项目可以实现透明化接入。缺点是语言耦合度较高，跨语言支持难度较大。国内常见的冶理型 RPC 框架如下：

Dubbo: Dubbo 是阿里巴巴公司开源的一个 Java 高性能优秀的服务框架，使得应用可通过高性能的 RPC 实现服务的输出和输入功能，可以和 Spring 框架无缝集成。当年在淘宝内部，Dubbo 由于跟淘宝另一个类似的框架 HSF 有竞争关系，导致 Dubbo 团队解散，最近又活过来了，有专职同学投入。
DubboX: DubboX 是由当当在基于 Dubbo 框架扩展的一个 RPC 框架，支持 REST 风格的远程调用、Kryo/FST 序列化，增加了一些新的feature。
Motan: Motan 是新浪微博开源的一个 Java 框架。它诞生的比较晚，起于 2013 年，2016 年 5 月开源。Motan 在微博平台中已经广泛应用，每天为数百个服务完成近千亿次的调用。
rpcx: rpcx 是一个类似阿里巴巴 Dubbo和微博Motan的分布式的 RPC 服务框架，基于 Golang net/rpc 实现。但是 rpcx 基本只有一个人在维护，没有完善的社区，使用前要慎重，之前做 Golang 的 RPC 选型时也有考虑这个，最终还是放弃了，选择了 gRPC，如果想自己自研一个 RPC 框架，可以参考学习一下。

6、名字发现/服务发现

名字发现和服务发现分为两种模式，一个是客户端发现模式，一种是服务端发现模式。

框架中常用的服务发现是客户端发现模式。

所谓服务端发现模式是指客户端通过一个负载均衡器向服务发送请求，负载均衡器查询服务注册表并把请求路由到一台可用的服务实例上。现在常用的负载均衡器都是此类模式，常用于微服务中。

所有的名字发现和服务发现都要依赖于一个可用性非常高的服务注册表，业界常用的服务注册表有如下三个：

etcd，一个高可用、分布式、一致性、key-value方式的存储，被用在分享配置和服务发现中。两个著名的项目使用了它：k8s和Cloud Foundry。
consul，一个发现和配置服务的工具，为客户端注册和发现服务提供了API，Consul还可以通过执行健康检查决定服务的可用性。
Apache Zookeeper，是一个广泛使用、高性能的针对分布式应用的协调服务。Apache Zookeeper本来是 Hadoop 的子工程，现在已经是顶级工程了。除此之外也可以自己实现服务实现，或者用 Redis 也行，只是需要自己实现高可用性。

7、关系数据库

关系数据库分为两种，一种是传统关系数据，如 Oracle, MySQL，Maria, DB2，PostgreSQL 等等，另一种是 NewSQL，即至少要满足以下五点的新型关系数据库：

完整地支持SQL，支持JOIN / GROUP BY /子查询等复杂SQL查询；
支持传统数据标配的 ACID 事务，支持强隔离级别。
具有弹性伸缩的能力，扩容缩容对于业务层完全透明。
真正的高可用，异地多活、故障恢复的过程不需要人为的接入，系统能够自动地容灾和进行强一致的数据恢复。
具备一定的大数据分析能力

传统关系数据库用得最多的是 MySQL，成熟，稳定，一些基本的需求都能满足，在一定数据量级之前基本单机传统数据库都可以搞定，而且现在较多的开源系统都是基于 MySQL，开箱即用，再加上主从同步和前端缓存，百万 pv 的应用都可以搞定了。不过 CentOS 7 已经放弃了 MySQL，而改使用 MariaDB。MariaDB 数据库管理系统是 MySQ L的一个分支，主要由开源社区在维护，采用GPL 授权许可。开发这个分支的原因之一是：甲骨文公司收购了 MySQL 后，有将 MySQ L闭源的潜在风险，因此社区采用分支的方式来避开这个风险。

在 Google 发布了F1: A Distributed SQL Database That Scales和Spanner: Google’s Globally-Distributed Databasa之后，业界开始流行起 NewSQL。于是有了 CockroachDB，于是有了奇叔公司的 TiDB。国内已经有比较多的公司使用 TiDB，之前在创业公司时在大数据分析时已经开始应用 TiDB，当时应用的主要原因是 MySQL 要使用分库分表，逻辑开发比较复杂，扩展性不够。

8、NoSQL

NoSQL 顾名思义就是 Not-Only SQL，也有人说是 No – SQL, 个人偏向于Not – Only SQL,它并不是用来替代关系库，而是作为关系型数据库的补充而存在。

常见 NoSQL 有4个类型：

键值，适用于内容缓存，适合混合工作负载并发高扩展要求大的数据集，其优点是简单，查询速度快，缺点是缺少结构化数据，常见的有 Redis, Memcache, BerkeleyDB 和 Voldemort 等等；
列式，以列簇式存储，将同一列数据存在一起，常见于分布式的文件系统，其中以 Hbase，Cassandra 为代表。Cassandra 多用于写多读少的场景，国内用得比较多的有 360，大概 1500 台机器的集群，国外大规模使用的公司比较多，如 Ebay，Instagram，Apple 和沃尔玛等等；
文档，数据存储方案非常适用承载大量不相关且结构差别很大的复杂信息。性能介于 kv 和关系数据库之间，它的灵感来于 lotus notes，常见的有 MongoDB，CouchDB 等等；
图形，图形数据库擅长处理任何涉及关系的状况。社交网络，推荐系统等。专注于构建关系图谱，需要对整个图做计算才能得出结果，不容易做分布式的集群方案，常见的有 Neo4J，InfoGrid 等。

除了以上4种类型，还有一些特种的数据库，如对象数据库，XML 数据库，这些都有针对性对某些存储类型做了优化的数据库。

在实际应用场景中，何时使用关系数据库，何时使用 NoSQL，使用哪种类型的数据库，这是我们在做架构选型时一个非常重要的考量，甚至会影响整个架构的方案。

个人补充： NOSQL更适合哪种需要快速迭代，快速发布产品抢占市场的创业公司使用，比如MongoDB，你完全不用太关心字段类型，字段长度，索引，是否为空等。想存什么存什么。

9、消息中间件

消息中间件在后台系统中是必不可少的一个组件，一般我们会在以下场景中使用消息中间件：

异步处理：异步处理是使用消息中间件的一个主要原因，在工作中最常见的异步场景有用户注册成功后需要发送注册成功邮件、缓存过期时先返回老的数据，然后异步更新缓存、异步写日志等等；通过异步处理，可以减少主流程的等待响应时间，让非主流程或者非重要业务通过消息中间件做集中的异步处理。
系统解耦：比如在电商系统中，当用户成功支付完成订单后，需要将支付结果给通知ERP系统、发票系统、WMS、推荐系统、搜索系统、风控系统等进行业务处理；这些业务处理不需要实时处理、不需要强一致，只需要最终一致性即可，因此可以通过消息中间件进行系统解耦。通过这种系统解耦还可以应对未来不明确的系统需求。
削峰填谷：当系统遇到大流量时，监控图上会看到一个一个的山峰样的流量图，通过使用消息中间件将大流量的请求放入队列，通过消费者程序将队列中的处理请求慢慢消化，达到消峰填谷的效果。最典型的场景是秒杀系统，在电商的秒杀系统中下单服务往往会是系统的瓶颈，因为下单需要对库存等做数据库操作，需要保证强一致性，此时使用消息中间件进行下单排队和流控，让下单服务慢慢把队列中的单处理完，保护下单服务，以达到削峰填谷的作用。

业界消息中间件是一个非常通用的东西，大家在做选型时有使用开源的，也有自己造轮子的，甚至有直接用 MySQL 或 Redis 做队列的，关键看是否满足你的需求，如果是使用开源的项目，以下的表格在选型时可以参考：

以上图的纬度为：名字成熟度所属社区/公司文档授权方式开发语言支持的协议客户端支持的语言性能持久化事务集群负载均衡管理界面部署方式评价

10 、代码管理

代码是互联网创业公司的命脉之一，代码管理很重要，常见的考量点包括两块：

安全和权限管理，将代码放到内网并且对于关系公司命脉的核心代码做严格的代码控制和机器的物理隔离；
代码管理工具，Git 作为代码管理的不二之选，你值得拥有。Gitlab 是当今最火的开源 Git 托管服务端，没有之一，虽然有企业版，但是其社区版基本能满足我们大部分需求，结合 Gerrit 做 Code review，基本就完美了。当然 Gitlab 也有代码对比，但没Gerrit 直观。Gerrit 比 Gitlab 提供了更好的代码检查界面与主线管理体验，更适合在对代码质量有高要求的文化下使用。

11 、持续集成

持续集成简，称 CI(continuous integration)，是一种软件开发实践，即团队开发成员经常集成他们的工作，每天可能会发生多次集成。每次集成都通过自动化的构建（包括编译，发布，自动化测试）来验证，从而尽早地发现集成错误。持续集成为研发流程提供了代码分支管理/比对、编译、检查、发布物输出等基础工作，为测试的覆盖率版本编译、生成等提供统一支持。

业界免费的持续集成工具中系统我们有如下一些选择：

Jenkins：Jjava写的有强大的插件机制，MIT协议开源（免费，定制化程度高，它可以在多台机器上进行分布式地构建和负载测试）。Jenkins可以算是无所不能，基本没有 Jenkins 做不了的，无论从小型团队到大型团队 Jenkins 都可以搞定。不过如果要大规模使用，还是需要有人力来学习和维护。
TeamCity： TeamCity与Jenkins相比使用更加友好，也是一个高度可定制化的平台。但是用的人多了，TeamCity就要收费了。
Strider： Strider 是一个开源的持续集成和部署平台，使用 Node.js 实现，存储使用的是 MongoDB，BSD 许可证，概念上类似 Travis 和Jenkins。
GitLabCI：从GitLab8.0开始，GitLab CI 就已经集成在 GitLab，我们只要在项目中添加一个 .gitlab-ci.yml 文件，然后添加一个Runner，即可进行持续集成。并且 Gitlab 与 Docker 有着非常好的相互协作的能力。免费版与付费版本不同可以参见这里：https://about.gitlab.com/products/feature-comparison/
Travis：Travis 和 Github 强关联；闭源代码使用 SaaS 还需考虑安全问题；不可定制；开源项目免费，其它收费；
Go: Go是ThoughtWorks公司最新的Cruise Control的化身。除了 ThoughtWorks 提供的商业支持，Go是免费的。它适用于Windows，Mac和各种Linux发行版。

12 、日志系统

日志系统一般包括打日志，采集，中转，收集，存储，分析，呈现，搜索还有分发等。一些特殊的如染色，全链条跟踪或者监控都可能需要依赖于日志系统实现。日志系统的建设不仅仅是工具的建设，还有规范和组件的建设，最好一些基本的日志在框架和组件层面加就行了，比如全链接跟踪之类的。

对于常规日志系统ELK能满足大部分的需求，ELK 包括如下组件：

ElasticSearch 是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。
Logstash 是一个完全开源的工具，它可以对你的日志进行收集、分析，并将其存储供以后使用。
Kibana 是一个开源和免费的工具，它可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面，可以帮助汇总、分析和搜索重要数据日志。
Filebeat 已经完全替代了 Logstash-Forwarder 成为新一代的日志采集器，同时鉴于它轻量、安全等特点，越来越多人开始使用它。

因为免费的 ELK 没有任何安全机制，所以这里使用了 Nginx 作反向代理，避免用户直接访问 Kibana 服务器。加上配置 Nginx 实现简单的用户认证，一定程度上提高安全性。另外，Nginx 本身具有负载均衡的作用，能够提高系统访问性能。ELK 架构如图4所示：

对于有实时计算的需求，可以使用 Flume+Kafka+Storm+MySQL方案，一般架构如图5所示：

其中：

Flume 是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的日志收集系统，支持在日志系统中定制各类数据发送方，用于收集数据;同时，Flume 提供对数据进行简单处理，并写到各种数据接受方(可定制)的能力。
Kafka 是由 Apache 软件基金会开发的一个开源流处理平台，由 Scala 和 Java 编写。其本质上是一个“按照分布式事务日志架构的大规模发布/订阅消息队列”，它以可水平扩展和高吞吐率而被广泛使用。 Kafka 追求的是高吞吐量、高负载，Flume 追求的是数据的多样性，二者结合起来简直完美。

13、监控系统

监控系统只包含与后台相关的，这里主要是两块，一个是操作系统层的监控，比如机器负载，IO，网络流量，CPU，内存等操作系统指标的监控。另一个是服务质量和业务质量的监控，比如服务的可用性，成功率，失败率，容量，QPS 等等。常见业务的监控系统先有操作系统层面的监控（这部分较成熟），然后扩展出其它监控，如 zabbix，小米的 open-falcon，也有一出来就是两者都支持的，如 prometheus。如果对业务监控要求比较高一些，在创业选型中建议可以优先考虑 prometheus。这里有一个有趣的分布，如图6所示

亚洲区域使用 zabbix 较多，而美洲和欧洲，以及澳大利亚使用 prometheus 居多，换句话说，英文国家地区（发达国家？）使用prometheus 较多。

Prometheus 是由 SoundCloud 开发的开源监控报警系统和时序列数据库( TSDB )。Prometheus 使用 Go 语言开发，是 Google BorgMon 监控系统的开源版本。相对于其它监控系统使用的 push 数据的方式，prometheus 使用的是 pull 的方式，其架构如图7所示：

如上图所示，prometheus 包含的主要组件如下：

Prometheus Server 主要负责数据采集和存储，提供 PromQL 查询语言的支持。Server 通过配置文件、文本文件、Zookeeper、Consul、DNS SRV Lookup等方式指定抓取目标。根据这些目标会，Server 定时去抓取 metric s数据，每个抓取目标需要暴露一个 http 服务的接口给它定时抓取。

客户端SDK：官方提供的客户端类库有 go、java、scala、python、ruby，其他还有很多第三方开发的类库，支持 nodejs、php、erlang 等。

Push Gateway 支持临时性 Job 主动推送指标的中间网关。
Exporter Exporter 是Prometheus的一类数据采集组件的总称。它负责从目标处搜集数据，并将其转化为 Prometheus 支持的格式。与传统的数据采集组件不同的是，它并不向中央服务器发送数据，而是等待中央服务器主动前来抓取。Prometheus提供多种类型的 Exporter 用于采集各种不同服务的运行状态。目前支持的有数据库、硬件、消息中间件、存储系统、HTTP服务器、JMX等。
alertmanager：是一个单独的服务，可以支持 Prometheus 的查询语句，提供十分灵活的报警方式。
Prometheus HTTP API的查询方式，自定义所需要的输出。
Grafana 是一套开源的分析监视平台，支持 Graphite, InfluxDB, OpenTSDB, Prometheus, Elasticsearch, CloudWatch 等数据源，其 UI 非常漂亮且高度定制化。

创业公司选择 Prometheus + Grafana 的方案，再加上统一的服务框架(如 gRPC )，可以满足大部分中小团队的监控需求。

14、配置系统

随着程序功能的日益复杂，程序的配置日益增多：各种功能的开关、降级开关，灰度开关，参数的配置、服务器的地址、数据库配置等等，除此之外，对后台程序配置的要求也越来越高：配置修改后实时生效，灰度发布，分环境、分用户，分集群管理配置，完善的权限、审核机制等等，在这样的大环境下，传统的通过配置文件、数据库等方式已经越来越无法满足开发人员对配置管理的需求，业界有如下两种方案：

基于 zk 和 etcd，支持界面和 api ，用数据库来保存版本历史，预案，走审核流程，最后下发到 zk 或 etcd 这种有推送能力的存储里（服务注册本身也是用 zk 或 etcd，选型就一块了）。客户端都直接和 zk 或 etcd 打交道。至于灰度发布，各家不同，有一种实现是同时发布一个需要灰度的 IP 列表，客户端监听到配置节点变化时，对比一下自己是否属于该列表。PHP 这种无状态的语言和其他 zk/etcd 不支持的语言，只好自己在客户端的机器上起一个 Agent 来监听变化，再写到配置文件或共享内存，如 360 的 Qconf。
基于运维自动化的配置文件的推送，审核流程，配置数据管理和方案一类似，下发时生成配置文件，基于运维自动化工具如Puppet，Ansible 推送到每个客户端，而应用则定时重新读取这个外部的配置文件，灰度发布在下发配置时指定IP列表。

创业公司前期不需要这种复杂，直接上 zk，弄一个界面管理 zk 的内容，记录一下所有人的操作日志，程序直连 zk，或者或者用Qconf 等基于 zk 优化后的方案。

15、发布系统/部署系统

从上图中可以看出，从开发人员写下代码到服务最终用户是一个漫长过程，整体可以分成三个阶段：

从代码（Code）到成品库（Artifact）这个阶段主要对开发人员的代码做持续构建并把构建产生的制品集中管理，是为部署系统准备输入内容的阶段。从制品到可运行服务这个阶段主要完成制品部署到指定环境，是部署系统的最基本工作内容。从开发环境到最终生产环境这个阶段主要完成一次变更在不同环境的迁移，是部署系统上线最终服务的核心能力。发布系统集成了制品管理，发布流程，权限控制，线上环境版本变更，灰度发布，线上服务回滚等几方面的内容，是开发人员工作结晶最终呈现的重要通道。开源的项目中没有完全满足的项目，如果只是 Web 类项目，Walle、Piplin 都是可用的，但是功能不太满足，创业初期可以集成 Jenkins + Gitlab + Walle (可以考虑两天时间完善一下)，以上方案基本包括制品管理，发布流程，权限控制，线上环境版本变更，灰度发布（需要自己实现），线上服务回滚等功能。

16、跳板机

跳板机面对的是需求是要有一种能满足角色管理与授权审批、信息资源访问控制、操作记录和审计、系统变更和维护控制要求，并生成一些统计报表配合管理规范来不断提升IT内控的合规性，能对运维人员操作行为的进行控制和审计，对误操作、违规操作导致的操作事故，快速定位原因和责任人。其功能模块一般包括：帐户管理、认证管理、授权管理、审计管理等等

开源项目中，Jumpserver 能够实现跳板机常见需求，如授权、用户管理、服务器基本信息记录等，同时又可批量执行脚本等功能；其中录像回放、命令搜索、实时监控等特点，又能帮助运维人员回溯操作历史，方便查找操作痕迹，便于管理其他人员对服务器的操作控制。

17、机器管理

机器管理的工具选择的考量可以包含以下三个方面：

是否简单，是否需要每台机器部署agent（客户端）语言的选择（puppet/chef vsansible/saltstack）开源技术，不看官网不足以熟练，不懂源码不足以精通；Puppet、Chef 基于 Ruby 开发，ansible、saltstack 基于 python 开发的速度的选择(ansiblevssaltstack) ansible基于SSH协议传输数据，Saltstack使用消息队列zeroMQ传输数据；大规模并发的能力对于几十台-200台规模的兄弟来讲，ansible的性能也可接受，如果一次操作上千台，用salt好一些。

一般创业公司选择 Ansible 能解决大部问题，其简单，不需要安装额外的客户端，可以从命令行来运行，不需要使用配置文件。至于比较复杂的任务，Ansible 配置通过名为 Playbook 的配置文件中的 YAML 语法来加以处理。Playbook 还可以使用模板来扩展其功能。

二、创业公司的选择

1、选择合适的语言

选择团队熟悉的/能掌控的，创业公司人少事多，无太多冗余让研发团队熟悉新的语言，能快速上手，能快速出活，出了问题能快速解决的问题的语言才是好的选择。选择更现代一些的，这里的现代是指语言本身已经完成一些之前需要特殊处理的特性，比如内存管理，线程等等。选择开源轮子多的或者社区活跃度高的，这个原则是为了保证在开发过程中减少投入，有稳定可靠的轮子可以使用，遇到问题可以在网上快速搜索到答案。选择好招人的一门合适的语言会让创业团队减少招聘的成本，快速招到合适的人。选择能让人有兴趣的与上面一点相关，让人感兴趣，在后面留人时有用。

2、选择合适的组件和云服务商

选择靠谱的云服务商；
选择云服务商的组件；
选择成熟的开源组件，而不是最新出的组件；
选择采用在一线互联网公司落地并且开源的，且在社区内形成良好口碑的产品；开源社区活跃度；
选择靠谱的云服务商，其实这是一个伪命题，因为哪个服务商都不靠谱，他们所承诺的那些可用性问题基本上都会在你的身上发生，这里我们还是需要自己做一些工作，比如多服务商备份，如用CDN，你一定不要只选一家，至少选两家，一个是灾备，保持后台切换的能力，另一个是多点覆盖，不同的服务商在CDN节点上的资源是不一样的。

选择了云服务商以后，就会有很多的产品你可以选择了，比较存储，队列这些都会有现成的产品，这个时候就纠结了，是用呢？还是自己在云主机上搭呢？在这里我的建议是前期先用云服务商的，大了后再自己搞，这样会少掉很多运维的事情，但是这里要多了解一下云服务商的组件特性以及一些坑，比如他们内网会经常断开，他们升级也会闪断，所以在业务侧要做好容错和规避。

关于开源组件，尽可能选择成熟的，成熟的组件经历了时间的考验，基本不会出大的问题，并且有成套的配套工具，出了问题在网上也可以很快的找到答案，你所遇到的坑基本上都有人踩过了。

3、制定流程和规范

制定开发的规范，代码及代码分支管理规范，关键性代码仅少数人有权限；
制定发布流程规范，从发布系统落地；
制定运维规范；
制定数据库操作规范，收拢数据库操作权限；
制定告警处理流程，做到告警有人看有人处理；
制定汇报机制，晨会/周报；

4、自研和选型合适的辅助系统

所有的流程和规范都需要用系统来固化，否则就是空中楼阁，如何选择这些系统呢？参照上个章节咱们那些开源的，对比一下选择的语言，组件之类的，选择一个最合适的即可。

比如项目管理的，看下自己是什么类型的公司，开发的节奏是怎样的，瀑布，敏捷的按项目划分，还是按客户划分等等，平时是按项目组织还是按任务组织等等

比如日志系统，之前是打的文本，那么上一个 ELK，规范化一些日志组件，基本上很长一段时间内不用考虑日志系统的问题，最多拆分一下或者扩容一下。等到组织大了，自己搞一个日志系统。

比如代码管理，项目管理系统这些都放内网，安全，在互联网公司来说，属于命脉了，命脉的东西还是放在别人拿不到或很难拿到的地方会比较靠谱一些。

5、选择过程中需要思考的问题

技术栈的选择有点像做出了某种承诺，在一定的时间内这种承诺没法改变，于是我们需要在选择的时候有一些思考。

看前面内容，有一个词出现了三次，合适，选择是合适的，不是最好，也不是最新，是最合适，适合是针对当下，这种选择是最合适的吗？比如用 Go 这条线的东西，技术比较新，业界组件储备够吗？组织内的人员储备够吗？学习成本多少？写出来的东西能满足业务性能要求吗？能满足时间要求吗？

向未来看一眼，在一年到三年内，我们需要做出改变吗？技术栈要做根本性的改变吗？如果组织发展很快，在 200 人，500 人时，现有的技术栈是否需要大动？

创业过程中需要考虑成本，这里的成本不仅仅是花费多少钱，付出多少工资，有时更重要的是时间成本，很多业务在创业时大家拼的就是时间，就是一个时间窗，过了就没你什么事儿了。

三、基于云的创业公司后台技术架构

结合上面内容的考量，在对一个个系统和组件的做选型之后，以云服务为基础，一个创业公司的后台技术架构如图10所示：

参考资料

http://database.51cto.com/art/201109/291781.htm https://zh.wikipedia.org/wiki/Kafka https://prometheus.io/docs/introduction/overview/ http://deadline.top/2016/11/23/配置中心那点事/ http://blog.fit2cloud.com/2016/01/26/deployment-system.html

remote work

Sat, 13 Dec 2025 02:14:42 GMT

remote work

小鹅通专注内容付费的技术服务商。 netlify 快速的根据你的静态文件生成一个带https和域名的网站。教程见这篇 dzone 可以学到一些DevOps相关的教程和工具的国外网站宜搭阿里出的快速搭建应用平台。

一个提供pojie软件的国外网站推荐下载IDM，下东西比迅雷快
落尘之木作者维护着去广告版的迅雷
吾爱破解比较著名的站点了，不定期开放注册，有时能找到不错的资料或视频教程。
PHP / Laravel 月刊
https://smee.io/提供代理webhook请求并发送到本地，一般调试程序会用到
SaaS微服务十二要素应用宣言参考：https://www.jianshu.com/p/bbdccd020a1d

分享一个Skype彩蛋：在发过言的聊天窗口快速点击7次以上会出现一个会跳舞的猴子。具体哪个版本加上的未知。

想流畅观看youbute等国外网站的话。有个比较好的做法是买个国外的vps，然后安装ssr。关于安装流程，非常简单有一键安装脚本。可以去这买，搬瓦工。很便宜，只想做代理的话不用买配置很高的。如果不想掏钱可以买谷歌云 Google Cloud Platform。前提是有国际信用卡和google账号。具体流程参见：isomeonegc，需要过墙才能打开。全局富强软件: https://getoutline.org/en/home 教程： https://cyhour.com/697/ Dler Cloud 同事在用的科学上网工具 https://getoutline.org/en/home 教程： https://free.com.tw/google-outline/

前端面试之道

牛客网收集各IT大厂的笔试面试题，没事做做上面的题全面提升IT编程能力

sourcegraph 装了chrome扩展之后，比如在github上分析源码的好伙伴。提供定义跳转，引用及搜索等功能。

bearychat 可以看成是国产简化版的slack吧

SSL/TLS安全评估报告评估网站的ssl安全程度

Sat, 13 Dec 2025 02:14:42 GMT

有时候我们想新建某类型文件的时候，默认出现一些基础代码，而不是空白的。比如当新建一个 html 文件基础代码是这样的：

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <title></title>
</head>
<body>

</body>
</html>

同理，当新建php文件，我希望是这样：

<?php
/**
 * Created by PhpStorm
 * Author Finley Ma <公司邮箱地址>
 * Date: 2018/7/5
 * Time: 下午11:56
 */

其实 PHPStorm 已经预设了一些信息， Editor - File and Code Templates

关于 #parse("PHP File Header.php") 可以理解为一种语法指令

PHP File Header.php 在 Includes Tab 下面，一看就是方便复用的

比如，我在Files Tab下新建一个"JavaScript File", 内容照样填 #parse("PHP File Header.php") 这样，当新建一个JS文件的效果和PHP一样了。

Sat, 13 Dec 2025 02:14:42 GMT

高效沟通

Sat, 13 Dec 2025 02:14:42 GMT

高效沟通

有效的沟通是事业成功的必要条件。不管你的目标是成为一名卓越的管理者，还是成为某个领域的技术牛人，你都应该提高自己的沟通能力。
能把深奥，晦涩难懂的知识写得通俗易懂，只有真正的专家才可以做到。比如《从一到无穷大》有非常难以理解的爱因斯坦相对论，然而这本书却被作者写成了中学生都可以读懂的科普书。
这个世界上的学习只有两种，一种是被动学习，一种是主动学习。听课，看书，看视频，看别人的演讲，这些统统都是被动学习，知识的留存度最多只有30%。而与别人讨论，实践和传授给别人，是主动学习，可以让你掌握知识的50%到90%以上。

这个世界不存在知识不够的情况，真的还没有到知识被少数精英的攥在手里面不给大家的情况，这个世界上的知识就像阳光和空气一样，根本不需要你付费，你就可以获得的。问题是，大多数人都失去了获取知识的能力，你就算把知识放在他们面前，他们也不会去学习，他们需要你喂，甚至需要你帮他们嚼碎了，帮他们消化过了，他们才能吃得到，消化得了。这才是最大的问题。不好意思，我又说实话了，难听但是对你有用。

说的太对了，非常赞同

永远不要跟客户说不，要有条件地说是，告诉客户不同的期望要有不同的付出和不同的成本。不要帮客户做决定，而是给客户提供尽可能多的选项，让客户来做决定。
总结下来，在与客户沟通预期时，我通常会坚持以下几个原则。

* 一定要给客户选择权，永远不要说不，要有条件地说是。
* 降低期望的同时给予其他的补偿。
* 提高期望的同时附加更多的条件。
* 对于比较大的期望要分步骤达到客户的期望。
* 不要帮客户做决定，而是给客户提供尽可能多的选项，然后引导客户做决定。

讨价还价是这个世界能运转的原因之一，要学会使用。

这点我感触很深，我们目前的项目是每周一次迭代发布，有时候客户会添加进来一些临时任务，所以任务就很多，作为一名PM，每天和客户开会一定要跟客户确定任务的优先级，告诉他任务的预估工作量，最终本周的发布我们能做到什么程度，哪些任务能放到下周。

Sat, 13 Dec 2025 02:14:42 GMT

2018-11-06更新：如果在chrome浏览器中过期时间 expiration date显示的是1969。答案说明cookie是临时的，只保持在这个会话周期，当浏览器关闭时cookie会被清除。 Unix time was started at the beginning of 1970, that means that -1 is in 1969. And that is a commonly used value for "unknown" if the expected value is usually positive. And for cookies MaxAge with a negative value means that the cookie is not stored persistently and will be deleted when the Web browser exits.

2018-08-27更新：使用cookie前强烈建议先看下MDN的这篇基础文章创建cookie可以配置的选项 Expires，Secure，HttpOnly，Domain，Path，SameSite。为避免跨域脚本 (XSS) 攻击，通过JavaScript的 Document.cookie API无法访问带有 HttpOnly 标记的Cookie，它们只应该发送给服务端。

最近在开发一个前后台分离的项目。前台是 localhost:8080，基于vue，请求用的axios库，后台是地址 localhost:8111，使用的是NodeJS。也就是前台发起的请求是跨域的。现在流程是这样的：前台向后台请求接口，后台会看到set-cookie，可是我发现前端JS 怎么也拿不到 cookie（后来发现是cookie被设置了HttpOnly）。axios的response里没有。但是在chrome里可以看到设置的cookie。查了文档，当需要跨域请求，前台需要设置 withCredentials 为 true。这样每次请求会自动带上 cookie，但是后台也需要设置 Access-Control-Allow-Credentials: true，就不能用*来设置Origin了，即 Access-Control-Allow-Origin:* , 而应该相应的改成Access-Control-Allow-Origin: localhost:8080, 这样就比较尴尬了，到时候前台是对大众开放，需要允许所有来源，难道没有别的办法了？相信标准这么做也是为了安全。查了也有解决办法。都还没有尝试。比如

可以在nginx中设置，对于过来的请求，让 nginx 自动加上请求头。下面的方法没试，不是嫌麻烦，是部署的工作不是自己的人来做。

if ($http_origin ~* ( https?://.*\.example\.com(:[0-9]+)?$)) {
    add_header Access-Control-Allow-Origin: $http_origin;
}

对于后端，比如express。每个请求都走一遍中间件, 取出 headers 里的域名, 写到 CORS 头部去：

app = express()

app.all('/*', (req, res, next) => {
  if (req.headers.origin) {
    res.header("Access-Control-Allow-Origin", req.headers.origin)
    res.header("Access-Control-Allow-Credentials", true)
    res.header('Access-Control-Allow-Methods', 'PUT, GET, POST, DELETE, OPTIONS')
    # 下面一行意义不明确...
    res.header("Access-Control-Allow-Headers", "X-Requested-With, AUTHORIZATION")
  }
  next(); // pass control to the next handler
});
next()

其实使用cookie做前后端分离真的没有 token 或 jwt 好用。机密的信息不要放到cookie中比较好。

==== 更新使用下面的方法在本地可行

if (process.env.NODE_ENV == 'local') {
    app.use(function(req, res, next) {
        res.header("Access-Control-Allow-Credentials", true);
        res.header("Access-Control-Allow-Origin", req.headers.origin);
        res.header("Access-Control-Allow-Headers", "Origin, X-Requested-With, Content-Type, Accept");
        next();
    });
}else {
    app.use(cors());
}

Sat, 13 Dec 2025 02:14:42 GMT

今天在一个全新的Ubuntu16.04主机上配置PHP，MySQL，Nginx环境。这种事情我已经做过很多遍了。应该是信手拈来。环境很快就搭建起来了，本地浏览器访问主机IP后确始终显示不出来页面。我配置的是8001端口，难道防火墙限制了？这个主机是天猫聚石塔用的，查了文档果然有如下说明：

好吧，我不得不换成80端口。然后我再刷新浏览器竟然显示 "File not found"。下面是我的解决流程:

一般来说这是nginx配置文件中root的项目根目录路径不对所致，检查nginx配置文件无误，排除。
用 tail -n 20 /var/log/nginx/error 查看错误日志，内容是 FastCGI sent in stderr primary script unknown while reading response header from upstream
查了一会网上说的，总结是俩原因：一个是 nginx中的fastcgi_param段配置有误，一个是文件权限问题。
先排除 fastcgi_param 问题，因为同样的配置在其他同样的操作系统运行时正常。唯一不同的是在其他主机默认是ubuntu用户，在这个上面是root用户。所以我觉得是文件权限问题。
先后给项目目录加 www-data 用户组，给 /run/php/php-fpm.sock 提高权限。依然不行。
正一筹莫展之际，我发现项目的全路径是 /root/project 而并不是 /home/root/project。而/root的权限是 drwx------ 当我执行完 chmod 755 /root。页面终于打开了，我只想说一句，Linux真难啊。

Sat, 13 Dec 2025 02:14:42 GMT

首先互联网使得获取信息更加容易。什么不懂的百度，Google一下就OK，非常方便，Youbute上甚至还有教你如何制作火箭和炸弹的视频。
互联网催生了更多产业和职业互联网带来了电子购物，电子移动支付，还有团购，直播。但是有些是欣欣向荣有些是昙花一现。比如团购网站，从一开始的 "百团大战" 到现在只剩下美团，糯米等屈指可数的几个。有人还知道中国第一家上线的团购网站是满座网吗？我之前还帮忙做过他们的的CRM系统。现在早已被人忘去。我感觉直播也跟会团购网站一样，慢慢的只留下一到两个最有实力的。
互联网增加了贫富差距对于互联网普及率高的国家，互联网大大提高的工作效率，促进经济发展，但是在非洲等享受不到互联网便利的国家，贫富差距会更加加大。类似的还有一篇报道，“上网依赖”正在加剧贫富差距 )，报道说上网时间是与经济状况成反比的，越有钱的人越不大上网。经济状况好的人，往往更善于管理自己的时间。这个结论很有趣。互联网对我来说非常重要，没有了他，我甚至无法工作，因为我现在需要每天早上通过Gotomeeting和客户开会，我每天都需要Github提交代码，没有了互联网我的代码都没法管理了。互联网对于很多人已经是必不可少的工具。用的好用的坏完全在于自己。

Sat, 13 Dec 2025 02:14:42 GMT

比如我想学习react native。因为很多是从国外传进来的，国内还没有好的教程。教你一个低成本学习的方法。几乎免费获得国外的电子书。当然是英语不要太差。国外有两个专门出版IT技术类书籍的出版社 apress 和 packtpub 。上面的书卖的挺贵的，甚至比国内的还要贵。但是有个好处是只要你注册了帐号，每本书带的resource code下载是免费的。其实有时候根据目录光看代码就能学到不少东西。

找到你想要的书名，然后去这搜 wowebook 。他提供了上面俩出版社的大部分书籍。比如我搜索下，正好有我感兴趣的。

但是提供的下载链接，是一个叫uploaded.net的网盘，在国内是被蔽了。而且即便能打开也下载不了，除非是高级会员。这时候万能的某宝就派上用场了。

搜一下这个网盘名，有很多网盘中转站，1G 流量一块钱。还是比较划算的。你只需要把类似 http://uploaded.net/file/ihghmpku 这种链接贴到中转站管理平台里。服务器就会下载。然后提供给你另一个速度还蛮不错的下载地址。

Sat, 13 Dec 2025 02:14:42 GMT

github 不解释，不单是前端开发人员，对所有程序员来说就是个宝库

developers.google.com google开发者网站，了解google旗下产品最新开发动态。尤其是Chome，Chrome作为市场份额最多也是最强的浏览器，他的版本更新非常频繁。我的理念是：对于天天用到的工具，就要多去了解他。想尽办法提高效率。通过这个网站，我们可以第一时间了解google产品的最新动态，我主要学习Chome的新特性，怎么用到实际的开发中。

MDN Mozilla 开发者网络，学习web标准的好地方 Mozilla组织本身就参与标准的制定，权威性还是有的。

建议新人多逛上面的网站。

stackoverflow 我相信我们开发中遇到的90%的问题都能在上面找到答案，当然要善于搜索。

javascripting JS已经从web端延伸到移动端，甚至是桌面端。这个网站为你分门别类的列出了客户端用最流行的javascrpt类库，框架。

另外说几个我喜欢的国内的网站 w3cplus w3cschool 张鑫旭

方法1：

Sat, 13 Dec 2025 02:14:42 GMT

不同于使用英语流利说，或自己背单词看TED等方法，这种是自己学，缺乏环境，可能比较枯燥。

说几个找老外聊天的途径，亲测有效

前提：有一定的英语基础和交流能力。

方法1：

在reddit的汉语板块找语言交换学习者

Reddit是一个社交新闻站点，类似百度贴吧，豆瓣小组，有很多各种板块，时事政治，游戏，文化等，汉语板块里面还有一群想学汉语的老外，可以找到各种各样的语言交换学习者。

比如我看到有个Bren开头的老外说自己通过了汉语等级考试，想进一步提高自己的汉语水平

然后我给他发了站内信,Reddit里叫DM，并且很快加到了他的微信

相同的方法我找到了3-4个聊友，我发现绝大多数是大学生，他们对中国文化比较感兴趣

比如这个brendan。是堪培拉一所大学的新生，护理专业，平时还在超市打零工，我们约定每周聊3-4次，互相教对方语言

这里我打错了，应该是 Do you allow pets in your university?

不过对方还是可以看懂的

方法2：

去专门的语言交换app上找聊友

这里推荐三款，Tandem, Italki和helloTalk

我建议尽量找母语是纯正英语国家的聊友

另外提醒app上也有骗子，说不定他会给你来句，我是乌克兰人，给我点钱吧

Sat, 13 Dec 2025 02:14:42 GMT

技术是为业务服务的。不结合业务使用场景单纯进行框架，语言优劣对比都是扯淡。
技术是为业务服务的，只有当业务遇到发展瓶颈时，技术才能体现出它的价值。
造轮子就是一种知识变现。很多人光着急着去变现了，而忘记去积累。这些人，送他们一句话：先沸腾、再折腾。
理解需求是研发技术的第一步，你还需要具备非常深厚的专业知识和研发经验。
接上句，优化重构代码之前要先分析业务场景。
写组件时候要预留一些接口，考虑将来是否要求扩展，避免硬塞。
软件开发就是把一个复杂的问题分解成一系列简单的问题，再把一系列简单的解决方案组合成一个复杂的解决方案！
我们是用软件解决问题的工程师或程序员，不要自称为Java程序员，PHP程序员来限制自己的发展空间。了解语言的优缺点及使用场景，特定问题使用特定语言。
如果一个开发人员不清楚自己所做的产品盈利能力如何，是非常危险的，因为一旦这个产品不能盈利，他马上面临三个可能性:
1. 这个产品被砍掉，这个人被安排其他工作
2. 这个产品被砍掉，这个人失业了
3. 老板很仁慈，一直维持这个亏损的产品，但公司会因为亏损而关门，大家还是失业了
学习新技术的小技巧。比如打算掌握node+moogodb。可按照如下步骤：
1. 首先确立目标，确定时间及具体目标。采用项目驱动。如：一个月内使用 node+mogodb 做一个小型博客系统。如果按期完成奖励买电动牙刷，机械键盘等。
2. 先去node和mongo官网看文档学习基础知识，并确定技术框架，比如使用流行的express和mongoose。
3. 先自己大致写一些基础代码。
4. github是个宝库，是学习他人源码的好地方，可以搜索关键字express mongoose, express boilerplate 或 express skeleton等。选star比较多的项目。对比自己之前写的，边对比边重构。学习他人的代码组织，分层方式和结合自己习惯，不必完全照搬。
5. 去v2ex或专门的社区论坛(如node就去node-china)发帖介绍项目。请别人点评，欢迎star。
提高代码水平，一、多看优秀的源码，JS推荐看lodash，PHP可以看Yii2的源码。二、看完自己写一遍，或者用其他语言实现一遍。
多人合作开发项目中，需要有一个人专门维护数据库，就是说除了这个人其他人不能随意操作正式数据库，定义新表或字段必须所有成员进行讨论包含字段名，类型，长度，索引等。表名和字段必须带有comment 将讨论结果转换为sql邮件抄送给相关人员。
有些开发人员很'自恋'，就是学到了一点新技术就沾沾自喜，其实不过把官方的Demo例子照做了遍。最关键的话学到的新技术完全没有利用起来，要想方设法用到当前做的项目中，就是要产生最大的收益，其实对于客户来说，大多数时候并不关心你用的什么技术，他关心的时间和金钱。就是用最少的时间给我带来最大的收益。

Sat, 13 Dec 2025 02:14:42 GMT

开通服务	费用	购买途径
Youtube Premium	60元/年	V2EX拼车
B站大会员	73元/年	拼多多
网易云音乐	56元/年	闲鱼
Apple icloud 50GB	72元/年	官方
微信读书	158元/年	官方
合计	419元

摘自诸葛越《如何培养面向未来的孩子》用工作方法培养孩子

Sat, 13 Dec 2025 02:14:42 GMT

摘自诸葛越《如何培养面向未来的孩子》用工作方法培养孩子

持续有效的沟通

小的时候，你觉得孩子小，什么也不懂，只是帮他们做很多事，做饭、做衣服等。等到他们大了以后，比如到了青少年阶段，他们可能很忙，或者玩电脑，宁可跟同学朋友聊天，也不一定理你。

常常聊天是这样的，父母问，“学校怎么样啊？”孩子回答“很好”，然后就没有然后了。

但你想想，你在公司里，跟老板，跟同学，跟下属都不是这么沟通的。你不可能跟一个人说，“你怎么样？” 他回答 “很好”，就走了。

要把工作场合定期、保持交流的习惯，带回家，用在孩子身上。

至于具体怎么做，孩子不同的年龄阶段，可以有不同的方式。

婴幼儿的时候，爸爸妈妈能做的最好的方式是陪伴，是和他们一起去看这个有趣的世界。要多跟婴幼儿说话，不厌其烦地释看到的世界，哪怕你的孩子还不会说。
学龄前的孩子，讲故事是很好的方式你甚至可以跟孩子一起编故事，让他们做故事的主角。你不用怕编着编着就没话说了，我分享个我们家的聊天诀窍，跟孩子做各种问答，比如“我们来讲十个圆的东西”，“一起来说十件鱼不会做的事情”，这样的题目没有标准答案，既有趣，又可以教孩子一些概念。这个游戏,我们家很多年都玩得乐此不疲。
孩子上了小学以后，应该保持睡前谈话的习惯，听孩子分享他一天的见闻。这么做，能帮孩子整理他一天当中的经历，发现那些重要的事,既能帮他解决问题，还能发展他的表达能力。
孩子到了中学后，很多家长和孩子的沟通变得不是很通畅。这个时候，更加要让沟通变成习惯。比如说可以固定时间，每天晚上找一个睡觉前的时间聊一聊，或者周末找个时间聊一聊。

不要很刻意地一本正经地说，我们谈谈吧。我建议跟孩子一起做一些事情，比如说一起做饭，一起去买菜，一些日常的事情。你跟孩子一起做事，你会发现做事的时候，会自然而然地谈到一些关于学校的朋友的事，别人的事，他正在形成的世界观和看法。

和大孩子的沟通一定要注意几个方面：

多听少说，不要批评批判孩子的观点。

这点是很多家长都做不到的，他们都是忙于把自己的观点加在孩子头上。

不要有了问题才沟通

比如说学校学习不好，或者是跟别人有矛盾的时候再说，应该是在好的时候就随时沟通。很多时候大家就是讲一讲个人的生活，包括你自己的，你的工作，你遇到的问题也可以跟他聊一聊。养成这种习惯以后，当他真正遇到问题的时候，你自然而然就会了解了，就会这样做了。

持续不断的沟通非常重要，沟通要一直做，要很自然地去做。

我们在家里做父母，常常会认为孩子是自己的私有财产。虽然我们很爱孩子，很想保护他们，但是免不了就觉得他应该听我的，他应该跟我想的一样。

其实你退一步想，跟年轻的同事一样，孩子也是一个独立的人，在他有能力的事情上，父母应该让他独立运作，给他授权，你只定大方向就好了。

我家的老大其实小的时候蛮难管的，他很小就很有自己的想法，不爱听你的，尤其在细节上，你要去拧他，要阻止他做一件事，或者推他去做一件事，都是很难的这个也造成了很多的矛盾冲突。

但是从初中开始，我基本上就放手了。我定一些大的目标，比如学习要学好，体育锻炼要做，当然品德上不能有问题，大事情做好了，具体的东西我不管了。

后来发现这种平等的方法，非常有助于这个孩子的发展。

他很多事情都做得很好，很多事情他做的其实跟我想的不一样，他并没有去做我想让他做的事，但是他把他自己想做的事同时也是很正确的事情，做得非常好。父母应该这样想象，我们跟孩子也像在公司里跟其他人一样，是一个团队，大家是有共同目标的。这个共同目标包括孩子的成长，也包括我们自己的成长，要全家一起做，但是大家能力不同，分工不同，孩子并不需要要跟大人想的完全一样。

MiB和MB，KiB和KB等的区别

Sat, 13 Dec 2025 02:14:42 GMT

MiB和MB，KiB和KB等的区别

1KB(kilobyte)=1000byte, 1KiB(kibibyte)=1024byte； 1MB(megabyte)=1000000byte, 1MiB(mebibyte)=1048576byte； 1GB(gigabyte)=1000000000byte, 1GiB(Gibibyte)=1073741824byte； 1Mbps = 1Mb/s = 1000Kbps ≈ 976.563 kibps；ps 为 per second 的缩写；

硬盘生产商是以GB（十进制，即10的3次方=1000，如1MB=1000KB）计算的，而电脑（操作系统）是以GiB(2进制，即2的10次方，如1MiB=1024KiB）计算的，但竖内用户一般理解为1MB＝1024KB, 所以为了便于中文化的理解，翻译MiB为MB也是可以的。

1Mbps = 10的3次方Kbps；宽带网络中，运营商们所说的1M带宽是指1Mbps(megabits per second，兆比特每秒)。bps是bit per Second的缩写，也就是每秒多少“位”(bit)的意思。是用来计算资料传输速率的单“位”。

举例来说，电信局通常说的1M的带宽，所使用的单位就是bps，我们都知道一个字节等于8位（8个bit），而我们电脑的存储单位使用的是字节，也就是理论上每秒可以向硬盘下载1X1024/8=128KB/sec的数据。但这也只是理论上的速度。实际上则要再扣约12%的数据头信息（包Ethernet Header，IP Header，TCP Header，ATM Header等），各种各样的控制讯号。所以传输速度上限应112KB/sec左右，而不应该望文生义地理解为“每秒钟可以传送1M字节的数据。所以千万不要迷信广告，传输单位的写法上，B和b分别代表Bytes和bits，两者定义不同，差距是8倍。

1GB=1024MB，家里百兆带宽理论下载速度=100Mbps/8=12.5MB/s，下载1GB的电影仅需80秒；

回答 how are you? / how you doing?

Sat, 13 Dec 2025 02:14:42 GMT

来源都是 "Maaaxter English"

回答 how are you? / how you doing?

Couldn't be better 非常好 Can't complain 挺好的 Keeping busy 挺忙的 Been getting by 没什么特别的 Not so good 不怎么样

听不清

I'm losing you I can't hear you very well You're breaking up

Come again? Say that again ? Would you mind repeating that, please?

I've got bad reception/connection 我信号不好

赞同

I agree with you Well said Sounds good to me It works for me

商务常见缩写

COB -- close of business 工作日结束时间 COD -- cash on delivery 货到付款 N / A -- not applicable 不适用 BTW -- by the way 顺便说一下 FYI -- for your information 跟我说一下 ASAP -- as soon as possible 越快越好 TBD -- to be determined 还没决定 RSAP -- 请回复 please RSVP by COB Friday 请于周五下班前回复 APR -- Annual percentage rate 年利率 KPI -- key performance indicator 关键绩效指标 SOP -- standard operation procedure 标准操作规程 HQ -- Headquarter 公司总部 ETA -- estimated time of arrival 预计到达时间 YTD -- year to date 从开年到今天 EOM -- end of message 信息结束 ROI -- return of investment 投资回报 W/ -- with 有 W/O -- without 没有 FWIW -- for what it's worth 再说一句 KISS -- keep it simple stupid 保持简单易懂原则

辛苦了

对帮忙你的人

Thank you! I really appreciate it. I couldn't have done it without you. I don't know what I'd do without you.

对同学，同事

Good / great / fantastic job, guys! We did! 工作做完了 Keep up with the good work! 工作还没做完

夸人

He was born to do sth. Someone is a natural (at sth). Sth comes naturally to someone. Playing the piano comes naturally to him. Someone is a 'G' (gangster / badass) 某人超棒

我不打扰了你忙你的吧

I 'll leave you to it. I gotta go back to work. I won't disturb you any further.

LA 要连读，不要两个分开读

参考：https://www.youtube.com/watch?v=N5fAaKm8y2k&list=PLYWlpZe1L2k3-ltN4XpDXpVP9PzzmW7bZ&index=19

Sat, 13 Dec 2025 02:14:42 GMT

VAT (Value Added Tax)，是欧盟各国联邦税务局规定的“销售增值税”。海外商家和个人纳税者在欧盟各国本地的经营和服务活动，都需要注册VAT税号并履行税务申报义务。

如果您的产品使用欧盟各国本地仓储进行发货或物品所在地为欧盟各国，就属于欧盟VAT销售增值税应缴范畴，即便您使用的海外仓储服务是由第三方物流公司提供，也从未在欧盟各国当地开设办公室或者聘用当地员工，您仍然需要交纳VAT增值税。

不缴纳 VAT 的危害： 1、货物出口无法享受进口增值税退税；

2、货物可能被扣无法清关；

3、难以保证电商平台正常销售；

4、不能提供有效的VAT发票，降低海外客户成交率及好评率...

在线验证：https://ec.europa.eu/taxation_customs/vies/?locale=en

使用代码

php

$client = new \SoapClient('http://ec.europa.eu/taxation_customs/vies/checkVatService.wsdl');
$a = $client->checkVat(array(
    'countryCode' => 'NL',
    'vatNumber' => '807705111B01',
));

var_dump($a->valid);

rule

Sat, 13 Dec 2025 02:14:42 GMT

rule

detect drift 偏差检测

CF生成的资源然后又手动做了修改，这时候就会出现偏差，就需要做偏差检测。

这里手动修改了tag name

Stack

修改 15_stack_root.yaml

更新根堆栈

更新成功

删除根堆栈，其使用的嵌套模板都被删除了

生产环境中开启终止保护

传统ingress写法

Sat, 13 Dec 2025 02:14:42 GMT

AWS Load Balancer Controller 是一个控制器，用于帮助管理Kubernetes集群的弹性负载平衡器。

一般我们在EKS上安装AWS Load Balancer Controller附加组件，然后定义ingress，AWS Load Balancer Controller会自动帮我们创建ALB或NLB了

传统ingress写法

yaml

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  annotations:
    alb.ingress.kubernetes.io/healthcheck-interval-seconds: "300"
    alb.ingress.kubernetes.io/healthcheck-path: /
    alb.ingress.kubernetes.io/healthcheck-protocol: HTTP
    alb.ingress.kubernetes.io/listen-ports: '[{"HTTP": 80}]'
    alb.ingress.kubernetes.io/load-balancer-name: alb-demo
    alb.ingress.kubernetes.io/scheme: internet-facing
    alb.ingress.kubernetes.io/success-codes: "200"
    alb.ingress.kubernetes.io/target-type: ip
  name: alb-demo
  namespace: demo
spec:
  ingressClassName: alb
  rules:
  - http:
      paths:
      - backend:
        path: /*
        pathType: ImplementationSpecific
        service:
          name: svc-nginx
          port:
            number: 80

yaml

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: alb-demo
  namespace: demo
  annotations:
    alb.ingress.kubernetes.io/healthcheck-interval-seconds: "300"
    alb.ingress.kubernetes.io/healthcheck-path: /
    alb.ingress.kubernetes.io/healthcheck-protocol: HTTP
    alb.ingress.kubernetes.io/listen-ports: '[{"HTTP": 80}]'
    alb.ingress.kubernetes.io/load-balancer-name: alb-demo
    alb.ingress.kubernetes.io/scheme: internet-facing
    alb.ingress.kubernetes.io/success-codes: "200"
    alb.ingress.kubernetes.io/target-type: ip
    alb.ingress.kubernetes.io/conditions.rule-header: >
      [{"field":"http-header","httpHeaderConfig":{"httpHeaderName": "X-Customer-Header", "values":["202405271135505"]}},{"field":"path-pattern","pathPatternConfig":{"values":["/*"]}}]
    alb.ingress.kubernetes.io/conditions.default-header: >
      {"type":"fixed-response","fixedResponseConfig":{"contentType":"text/plain","statusCode":"403","messageBody":"Access Deny, please contact to [email protected]"}}
spec:
  ingressClassName: alb
  rules:
  - http:
      paths:
      - path: /*
        backend:
        pathType: Exact
        service:
          name: rule-header
          port:
            name: use-annotation

修改默认rule

default rule 总是一个返回固定响应404的text/plain

下面这个例子

添加一个 rule 并指定 target group
修改默认 rule，404 转为 403，并自定义响应内容

yaml

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: alb-demo
  namespace: demo
  annotations:
    alb.ingress.kubernetes.io/healthcheck-interval-seconds: "300"
    alb.ingress.kubernetes.io/healthcheck-path: /
    alb.ingress.kubernetes.io/healthcheck-protocol: HTTP
    alb.ingress.kubernetes.io/listen-ports: '[{"HTTP": 80}]'
    alb.ingress.kubernetes.io/load-balancer-name: alb-demo
    alb.ingress.kubernetes.io/scheme: internet-facing
    alb.ingress.kubernetes.io/success-codes: "200"
    alb.ingress.kubernetes.io/target-type: ip
    alb.ingress.kubernetes.io/actions.rule-tg: >
      {"type":"forward","forwardConfig":{"targetGroups":[{"serviceName":"svc-nginx","servicePort":"80"}]}}
    alb.ingress.kubernetes.io/conditions.rule-tg: >
      [{"field":"http-header","httpHeaderConfig":{"httpHeaderName": "X-DEMO-Header", "values":["1234567"]}}]
    alb.ingress.kubernetes.io/actions.default: |
      {"Type":"fixed-response","FixedResponseConfig":{"ContentType":"application/json","StatusCode":"403","MessageBody":"{ \"code\" : 403, \"message\" : \"Access deny, please contact to [email protected]\"  }"}}
spec:
  ingressClassName: alb
  defaultBackend:
    service:
      name: default
      port:
        name: use-annotation
  rules:
    - http:
        paths:
          - path: /*
            pathType: ImplementationSpecific
            backend:
              service:
                name: rule-tg
                port:
                  name: use-annotation

使用 ingressgroup 合并多个 ingress, 使用支持多种协议

IngressGroup功能能够将多个Ingress资源分组在一起。

controller将自动合并IngressGroup内所有Ingress的Ingress规则，并创建单个ALB。

此外，Ingress上定义的大多数注释仅适用于该Ingress定义的路径。

默认情况下，Ingresses不属于任何IngressGroup，我们将其视为由Ingress本身组成的“隐式IngressGroup”。

比如，适用于一个LB关联多个目标组，一个目标组要支持grpc协议，另外一个支持http1协议

要建两个ingress，name不一样，但要有相同的annotation alb.ingress.kubernetes.io/group.name

第一个 ingress 支持 https

yaml

kind: Ingress
apiVersion: networking.k8s.io/v1
metadata:
  name: nginx-http
  namespace: demo
  labels:
    app: grpcserver
    environment: dev
  annotations:
    alb.ingress.kubernetes.io/certificate-arn: >-
      arn:aws-cn:acm:cn-north-1:xxxxxx:certificate/7010f433-9d60-xxxx-xxxx-ecbcd772e3ad
    alb.ingress.kubernetes.io/group.name: demo-ingress-group
    # 注意监听规则的优先级，值越高越靠前
    alb.ingress.kubernetes.io/group.order: '10'
    alb.ingress.kubernetes.io/listen-ports: '[{"HTTPS":443}]'
    alb.ingress.kubernetes.io/scheme: internet-facing
    alb.ingress.kubernetes.io/target-type: ip
spec:
  ingressClassName: alb
  rules:
    - host: grpcserver.dev.mafeifan.com
      http:
        paths:
          - path: /hello
            pathType: Prefix
            backend:
              service:
                name: svc-nginx
                port:
                  number: 80

第二个 ingress 支持 grpc, 最终只创建一个 ALB

这种方法也适用于不同命名空间的ingress

yaml

kind: Ingress
apiVersion: networking.k8s.io/v1
metadata:
  name: grpcserver
  namespace: demo
  labels:
    app: grpcserver
    environment: dev
  annotations:
    alb.ingress.kubernetes.io/backend-protocol-version: GRPC
    # 注意监听规则的优先级，值越高越靠前
    alb.ingress.kubernetes.io/group.order: '100'
    alb.ingress.kubernetes.io/certificate-arn: >-
      arn:aws-cn:acm:cn-north-1:xxxxxx:certificate/7010f433-9d60-xxxx-xxxx-ecbcd772e3ad
    alb.ingress.kubernetes.io/group.name: demo-ingress-group
    alb.ingress.kubernetes.io/listen-ports: '[{"HTTP": 80}, {"HTTPS":443}]'
    alb.ingress.kubernetes.io/scheme: internet-facing
    alb.ingress.kubernetes.io/ssl-redirect: '443'
    alb.ingress.kubernetes.io/target-type: ip
spec:
  ingressClassName: alb
  rules:
    - host: grpcserver.dev.mafeifan.com
      http:
        paths:
          - path: /
            pathType: Prefix
            backend:
              service:
                name: grpcserver
                port:
                  number: 50051

最终生成LB效果如下:

https协议不使用443端口

上面的写法中，grpc 和 https 都占用了443端口，导致 https 不得不使用 /hello path 前缀，

我们继续优化，修改 nginx-http 让https走8001端口，grpcserver保持不变

yaml

kind: Ingress
apiVersion: networking.k8s.io/v1
metadata:
  name: nginx-http
  namespace: demo
  labels:
    app: grpcserver
    environment: dev
  annotations:
    alb.ingress.kubernetes.io/certificate-arn: >-
      arn:aws-cn:acm:cn-north-1:xxxxxx:certificate/7010f433-9d60-xxxx-xxxx-ecbcd772e3ad
    alb.ingress.kubernetes.io/group.name: demo-ingress-group
    # 注意监听规则的优先级，值越高越靠前
    alb.ingress.kubernetes.io/group.order: '10'
    alb.ingress.kubernetes.io/listen-ports: '[{"HTTPS":8001}]'
    alb.ingress.kubernetes.io/scheme: internet-facing
    alb.ingress.kubernetes.io/target-type: ip
spec:
  ingressClassName: alb
  rules:
    - host: grpcserver.dev.mafeifan.com
      http:
        paths:
          - path: /
            pathType: Prefix
            backend:
              service:
                name: svc-nginx
                port:
                  number: 80

EKS外的ALB目标指向EKS集群内service对应的IP或Instance

流程：

不通过ingress方式创建ALB，绑定安全组 sg-08d041a8f0b0
创建ALB的监听，比如80
创建一个目标组,IP类型并绑定到这个ALB，拿到ARN: arn:aws-cn:elasticloadbalancing:cn-north-1:xxxxx:targetgroup/mafei-demo/dec5f112d848f90c
- 此时目标组的目标为空
EKS 已存在service, svc-nginx

创建一个TargetGroupBinding，这样目标组的目标IP就是EKS中对应Pod的IP，如果扩缩Pod，目标组的IP会相应的发生变化

yaml

apiVersion: elbv2.k8s.aws/v1beta1
kind: TargetGroupBinding
metadata:
  namespace: mafei
  name: mafei-demo-tgb
spec:
  serviceRef:
    # route traffic to the k8s service
    name: svc-nginx  
    # the port of service
    port: 80    
  targetGroupARN: arn:aws-cn:elasticloadbalancing:cn-north-1:xxxxx:targetgroup/mafei-demo/dec5f112d848f90c
  networking:
    ingress:
      - from:
          - securityGroup:
              # 一般写为ALB的SG
              # EKS所在的安全组会添加一条规则，允许来自这个 ALB SG 的流量
              groupID: sg-08d041a8f0b0
        ports:
          - port: 80
            # Allow all TCP traffic from ALB SG
            protocol: TCP

参考

https://docs.amazonaws.cn/eks/latest/userguide/aws-load-balancer-controller.html

https://kubernetes-sigs.github.io/aws-load-balancer-controller/v2.6/guide/ingress/annotations/#ingressgroup

https://aws.amazon.com/cn/blogs/containers/patterns-for-targetgroupbinding-with-aws-load-balancer-controller/

https://aws.amazon.com/cn/blogs/china/use-aws-load-balancer-controller-s-targetgroupbinding-function-to-realize-flexible-load-balancer-management/

聚合

Sat, 13 Dec 2025 02:14:42 GMT

聚合

将多个项目同时运行就称为聚合。

只需在 pom 中作如下配置即可实现聚合：

xml

<modules>
    <module>web-connection-pool</module>
    <module>web-java-crawler</module>
</modules>

继承

在聚合多个项目时，如果这些被聚合的项目中需要引入相同的Jar，那么可以将这些Jar写入父pom中，各个子项目继承该pom即可。

父 pom 配置如下

xml

<dependencyManagement>
    <dependencies>
          <dependency>
            <groupId>cn.missbe.web.search</groupId>
            <artifactId>resource-search</artifactId>
            <packaging>pom</packaging>
            <version>1.0-SNAPSHOT</version>
          </dependency> 
    </dependencies>
</dependencyManagement>

子项目 pom 配置

xml

<parent>
  <groupId>父pom所在项目的groupId</groupId>
  <artifactId>父pom所在项目的artifactId</artifactId>
  <version>父pom所在项目的版本号</version>
</parent>
 <parent>
  <artifactId>resource-search</artifactId>
  <groupId>cn.missbe.web.search</groupId>
  <version>1.0-SNAPSHOT</version>
</parent>

Sat, 13 Dec 2025 02:14:42 GMT

java

int x = 10;
int y= 3;
// 13K, "K"是字符串，通过类型转换13被转成为"13", +是字符串连接符，最终输出13K
System.out.println(x+y+"K");
// ascii 和 数字互转
System.out.println((char)75);
System.out.println((byte)'K');
// 输出88， 88=13+75, (char)75 => 'K'
System.out.println(x+y+'K');
// 12aa66
System.out.println(6+6+"aa"+6+6);
// 12aa12
System.out.println(6+6+"aa"+(6+6));

Sat, 13 Dec 2025 02:14:42 GMT

https://github.com/fuzhengwei/itstack-demo-design

https://github.com/Snailclimb/JavaGuide

https://github.com/fishpro/spring-boot-study

可选

Sat, 13 Dec 2025 02:14:42 GMT

有耐心和英文还可以的同学可以下载官方的电子书

单机测试

环境 Ubuntu18.04

bash

# 可选
$ export JAVA_HOME=/usr/java/jdk-11.0.10

## 安装 kafka
```bash
$ tar -zxf mv kafka_2.13-3.1.0.tgz
$ mv kafka_2.13-3.1.0.tgz /usr/local/kafka
$ mkdir /tmp/kafka-logs

# 生成随机cluster id
$ ./bin/kafka-storage.sh random-uuid
1QZShiaqQQCN8XE797uesg

# 格式化存储目录，注意我们使用的是kraft中的配置文件

./bin/kafka-storage.sh format -t 1QZShiaqQQCN8XE797uesg -c ./config/kraft/server.properties
Formatting /tmp/kraft-combined-logs

# 启动 kafka
$ ./bin/kafka-server-start.sh ./config/kraft/server.properties

# 创建名为test的topic
$ ./bin/kafka-topics.sh --create --topic test --partitions 1 --replication-factor 1 --bootstrap-server localhost:9092

Created topic test.
# 查看topic
$ ./bin/kafka-topics.sh --bootstrap-server localhost:9092 --describe --topic test

Topic: test	TopicId: JyDAOV4AQ2mnCyD1Sh4DmA	PartitionCount: 1	ReplicationFactor: 1	Configs: segment.bytes=1073741824
	Topic: test	Partition: 0	Leader: 1	Replicas: 1	Isr: 1

# 生产消息到test主题(使用Ctrl-C停止生产者):
$ ./bin/kafka-console-producer.sh --bootstrap-server localhost:9092 --topic test
> test1
> test2

# 新开一个终端，消费来自test主题的消息:
# --from-beginning 是显示所有消息，而不是从最新的消息开始
$ ./bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

python客户端

生产者

python

# pip install kafka-python
from kafka import KafkaProducer

producer = KafkaProducer(bootstrap_servers='localhost:9092')
for i in range(5):
  future = producer.send('test', b'finley %d' % i)
  result = future.get(timeout=10)
  print(result)

消费者还是有问题

疑问

消费者跟生产者不在同一台机器上该如何连接

./bin/kafka-console-consumer.sh --bootstrap-server 49.232.138.70:9092 --topic test --from-beginning [2022-03-16 22:22:50,436] WARN [Consumer clientId=console-consumer, groupId=console-consumer-26123] Connection to node 0 (localhost.localdomain/127.0.0.1:9092) could not be established. Broker may not be available. (org.apache.kafka.clients.NetworkClient) [2022-03-16 22:22:50,537] WARN [Consumer clientId=console-consumer, groupId=console-consumer-26123] Connection to node 0 (localhost.localdomain/127.0.0.1:9092) could not be established. Broker may not be available. (org.apache.kafka.clients.NetworkClient)

在内网部署及访问kafka时，只需要配置listeners参数即可，比如

listeners=PLAINTEXT://192.168.133.11:9092

按照官网的参数说明，此时advertised.listeners默认值等于listeners参数的值，并被发布到zookeeper中，供客户端访问使用。此时kafka服务、broker之间通信都是使用192.168.133.11:9092

在内网部署kafka服务，并且生产者或者消费者在外网环境时，需要添加额外的配置，比如

advertised_listeners 监听器会注册在 zookeeper 中；

总结：advertised_listeners 是对外暴露的服务端口，kafka组件之间通讯用的是 listeners。

其实listeners是真正决定kafka启动时候的监听端口。advertised_listeners可以看做类似nginx的端口代理。

参考

https://github.com/dpkp/kafka-python

安装 zookeeper

Sat, 13 Dec 2025 02:14:42 GMT

有耐心和英文还可以的同学可以下载官方的电子书

单机测试

安装 zookeeper

环境 Ubuntu18.04

bash

$ tar -zxf apache-zookeeper-3.8.0-bin.tar.gz
$ mv apache-zookeeper-3.5.9-bin /usr/local/zookeeper
$ mkdir -p /var/lib/zookeeper
$ cp > /usr/local/zookeeper/conf/zoo.cfg << EOF
> tickTime=2000
> dataDir=/var/lib/zookeeper
> clientPort=2181
> EOF

bash

# 可选
$ export JAVA_HOME=/usr/java/jdk-11.0.10
# 启动zookeeper
$ /usr/local/zookeeper/bin/zkServer.sh start

# 现在可以通过连接到客户端端口并发送四个字母的命令srvr来验证ZooKeeper是否在独立模式下正确运行。 这将返回运行服务器的基本ZooKeeper信息:

telnet localhost 2181
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
srvr
Zookeeper version: 3.8.0-5a02a05eddb59aee6ac762f7ea82e92a68eb9c0f, built on 2022-02-25 08:49 UTC
Latency min/avg/max: 0/0.0/0
Received: 1
Sent: 0
Connections: 1
Outstanding: 0
Zxid: 0x0
Mode: standalone
Node count: 5
Connection closed by foreign host.

安装 kafka

bash

$ tar -zxf mv kafka_2.13-3.1.0.tgz
$ mv kafka_2.13-3.1.0.tgz /usr/local/kafka
$ mkdir /tmp/kafka-logs
# 启动 kafka
$ /usr/local/kafka/bin/kafka-server-start.sh -daemon /usr/local/kafka/config/server.properties

# 创建名为test的topic
$ /usr/local/kafka/bin/kafka-topics.sh --bootstrap-server localhost:9092 --create --replication-factor 1 --partitions 1 --topic test

Created topic test.
# 查看topic
$ /usr/local/kafka/bin/kafka-topics.sh --bootstrap-server localhost:9092 --describe --topic test

Topic: test	TopicId: GKrnmzgsTbSQNslvtKWkBw	PartitionCount: 1	ReplicationFactor: 1	Configs: segment.bytes=1073741824
	Topic: test	Partition: 0	Leader: 0	Replicas: 0	Isr: 0

# 生产消息到test主题(使用Ctrl-C停止生产者):
$ /usr/local/kafka/bin/kafka-console-producer.sh --bootstrap-server localhost:9092 --topic test
> test1
> test2

# 新开一个终端，消费来自test主题的消息:
$ /usr/local/kafka/bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning

疑问

消费者跟生产者不在同一台机器上该如何连接

在内网部署及访问kafka时，只需要配置listeners参数即可，比如

listeners=PLAINTEXT://192.168.133.11:9092

在内网部署kafka服务，并且生产者或者消费者在外网环境时，需要添加额外的配置，比如

advertised_listeners 监听器会注册在 zookeeper 中；

总结：advertised_listeners 是对外暴露的服务端口，kafka组件之间通讯用的是 listeners。

其实listeners是真正决定kafka启动时候的监听端口。advertised_listeners可以看做类似nginx的端口代理。

基本概念

Sat, 13 Dec 2025 02:14:42 GMT

消息队列的两种模式

基本概念

一台服务器就是一个broker，一个集群由多个broker组成，一个broker可以有多个topic，一个topic可以有多个partition分区，一个partition可以有多个segment
topic: 可以理解为一个队列或文件系统中的文件夹，所有的生产者和消费者都是面向topic的。每个partitions一般都会有一个消费者。
Kafka 通过分区来实现数据冗余和伸缩性。分区可以分布在不同的服务器上，也就是说，一个主题可以横跨多个服务器，以此来提供比单个服务器更强大的性能。
Kafka broker 默认的消息保留策略是这样的：要么保留一段时间（比如 7 天），要么保留到消息达到一定大小的字节数（比如 1GB）。当消息数量达到这些上限时，旧消息就会过期并被删除，所以在任何时刻，可用消息的总量都不会超过配置参数所指定的大小。
分区数的确定可以用主题吞吐量除以消费者吞吐量估算，如果每秒钟要从主题上写入和读取 1GB 的数据，并且每个消费者每秒钟可以处理 50MB 的数据，那么至少需要 20 个分区。这样就可以让 20 个消费者同时读取这些分区，从而达到每秒钟 1GB 的吞吐量。
主题可以配置自己的保留策略。例如，用于跟踪用户活动的数据可能需要保留几天，而应用程序的度量指标可能只需要保留几个小时。
Kafka 使用 Zookeeper 保存 Broker 的元数据,Kafka3 中使用Zookeeper已经不是必须的了

ack应答

三种qos：

级别0：不等待broker的ack回应，直接返回，毕竟没有经过leader与follower确认，优点是快，缺点是不可靠,生产环境很少使用
级别1：Producer发送消息到broker后，会等待leader落盘后再给producer返回信号，告诉producer数据已经收到了，但是也存在一种情况，那就是follower没有确认数据是否落盘，如果存在leader于follower数据不一致的情况，又碰巧leader挂了，选举了一个数据不健全的follower为新的leader,这就造成了数据丢失。所以它可靠性中等，性能不如0级。传输日志，允许丢失个别数据
级别-1：他要等leader与isr（可以看做一些比较活跃的follower集合）中follower确认全部落盘后在给producer回应，这种方式可靠，但是牺牲了性能，所以它是三种模式里最慢的。跟钱相关的数据，不允许丢失
数据完全可靠条件:ACK级别为-1 + 分区副本数>=2 + ISR 应答的最小副本数量>=2
精确一次 = 幂等性 + ACK级别为-1 + 分区副本数>=2 + ISR 应答的最小副本数量>=2

参考

https://www.cnblogs.com/rainple/p/15914065.html

Sat, 13 Dec 2025 02:14:42 GMT

版本5.5 小坑 https://github.com/InfyOmLabs/laravel-generator/issues/382

php artisan infyom:scaffold User --datatables=true

Sat, 13 Dec 2025 02:14:42 GMT

在做前后台分离的项目中，认证是必须的，由于http是无状态的。前台用户登录成功后，后台给前台返回token。之后前台给后台发请求每次携带token。

原理也非常简单：

前天在请求头中添加 Authorization，如下
后台取到值，然后去用户表的api_token列进行匹配，如果查到说明验证成功，并且返回相关信息。

Laravel本身自带几种验证方式，下面介绍下token认证的实现的方法。

前台在向后台发起请求时要携带一个token

后台需要做一个返回当前登录用户的信息的api，地址是 /api/user

先添加路由，当给 route/api.php 添加

Route::middleware('auth:api')->get('/user', function (Request $request) {
	echo $request->user();
});

如果浏览器直接访问 http://mydomain.com/api/user 会返回 401 Unauthorized 原因是在config/auth.php中有下面的关键配置

    'guards' => [
        'web' => [
            'driver' => 'session',
            'provider' => 'users',
        ],

        'api' => [
            'driver' => 'token',
            'provider' => 'users',
        ],
    ],

可以看到通过api访问走的是token认证，这里没有提供token所以就认证失败返回401了。

'driver' => 'token' 实际调用的是\vendor\laravel\framework\src\Illuminate\Auth\TokenGuard.php 上面说到我们需要在request里提供api_token参数，为了区别是哪个用户，需要在user表添加api_token字段

认证过程调用的是getTokenForRequest方法

    public function getTokenForRequest()
    {
        $token = $this->request->query($this->inputKey);

        if (empty($token)) {
            $token = $this->request->input($this->inputKey);
        }

        if (empty($token)) {
            $token = $this->request->bearerToken();
        }

        if (empty($token)) {
            $token = $this->request->getPassword();
        }

        return $token;
    }

这个bearerToken实际找header中是否存在Authorization

    public function bearerToken()
    {
        $header = $this->header('Authorization', '');

        if (Str::startsWith($header, 'Bearer ')) {
            return Str::substr($header, 7);
        }
    }

先给user表添加api_token字段 php artisan make:migration add_api_token_to_users --table=users 内容

class AddApiTokenToUsers extends Migration
{
    /**
     * Run the migrations.
     *
     * @return void
     */
    public function up()
    {
        Schema::table('users', function (Blueprint $table) {
	        $table->string('api_token', 60)->unique();
        });
    }

    /**
     * Reverse the migrations.
     *
     * @return void
     */
    public function down()
    {
        Schema::table('users', function (Blueprint $table) {
            $table->dropColumn('api_token');
        });
    }
}

打开navicat进到user表里，更新users的api_token。
打开postman 注意这里的header，key是Authorization，值就是Bearer+空格+刚才数据库里设的api_token

这样就能返回内容啦，修改其他用户的token能返回相应的用户信息，说明认证成功，功能基本完成！下面完善细节

完善逻辑修改 \app\Http\Controllers\Auth\RegisterController.php

    protected function create(array $data)
    {
        return User::create([
            'name' => $data['name'],
            'email' => $data['email'],
            'password' => bcrypt($data['password']),
            // 添加这行
	        'api_token' => str_random(60),
        ]);
    }

User Model 的 $fillable也改下

    protected $fillable = [
        'name', 'email', 'password', 'api_token',
    ];

如果在前台页面，发起请求时如何给后台传这个Authorization header? 方法如下注意，下面的是Laravel5.4的修改方法。新版本可能有细微区别，只要知道原理就能自己改了。

打开 \resources\assets\js\bootstrap.js 参照着csrf-token。合适的地方添加下面的代码

let token     = document.head.querySelector('meta[name="csrf-token"]');
let api_token = document.head.querySelector('meta[name="api-token"]');

if (token) {
    // 这个要参考axios的文档
    window.axios.defaults.headers.common['X-CSRF-TOKEN'] = Laravel.csrfToken =token.content;
    // 如果用的jquery
    // Fix jquery ajax crossDomain without Token
    // jQuery.ajaxPrefilter(function (options, originalOptions, jqXHR) {
    //     // if (options.crossDomain) {
    //     jqXHR.setRequestHeader('Authorization', api_token.content);
    //     jqXHR.setRequestHeader('X-CSRF-TOKEN', token.content);
    //     //}
    // });
} else {
    console.error('CSRF token not found: https://laravel.com/docs/csrf#csrf-x-csrf-token');
}


if (api_token) {
    window.axios.defaults.headers.common['Authorization'] = api_token.content;
} else {
    console.error('Authorization token not found: https://laravel.com/docs/csrf#csrf-x-csrf-token');
}

最后修改公共视图模版中 \views\layouts\app.blade.php

    <meta name="csrf-token" content="{{ csrf_token() }}">
    <meta name="api-token" content="{{ Auth::check() ? 'Bearer '.Auth::user()->api_token : 'Bearer ' }}">

总结：本质上给用户表添加api_token，后台根据这个字段判断是否是有效的用户，无效返回401，有效返回查询结果。优点是容易理解，缺点太简单，安全也不够。为了安全，可以实现下面的功能：

每次登录成功后刷新api_token为新值其实 Laravel 官方提供了一个 Laravel Passport 的包。Laravel Passport is an OAuth2 server and API authentication package 。具体使用请等更新。

问题：如何修改默认的api_token列？

Sat, 13 Dec 2025 02:14:42 GMT

https://medium.com/@taylorotwell/how-i-work-october-2018-edition-e66a09931e7f

例1

Sat, 13 Dec 2025 02:14:42 GMT

先看文档 Laravel 中间件提供了一种方便的机制来过滤进入应用的 HTTP 请求。这里实现一个只有admin角色才能访问特定路由的功能

新建middleware php artisan make:middleware MustBeAdmin
打开生成的 \app\Http\Middleware\MustBeAdmin.php 修改handle方法关于hasRole方法上一篇有讲解这里在请求前判断用户角色是否是admin，如果条件满足进到下一个中间件。不满足返回首页。

    public function handle($request, Closure $next)
    {
    	   // 前置
	    if ($request->user()->hasRole('admin')) {
		    return $next($request);
	    }
	    return redirect('/');
    }

让系统识别中间件。打开 \app\Http\Kernel 在 $routeMiddleware 数组里追加 'mustAdmin' => \App\Http\Middleware\MustBeAdmin::class,
关于中间件的调用非常灵活，比如

在 routes\web.php 中 Route::resource('posts', 'PostsController')->middleware('mustAdmin');
在控制器中

class PostsController extends Controller
{

	public function __construct()
	{
		$this->middleware('mustAdmin', ['only' => 'show']);
	}
...

项目中用到过的中间件

例1

在route中定义哪些角色可以访问，通过 role:ADMIN,TEACHER 知，role是中间件名字，后面的 ADMIN,TEACHER 是参数。 routes.php

Route::group(['middleware' => ['web', 'auth', 'role:ADMIN,TEACHER'], 'namespace' => '\StudentTrac\Guides\Controllers'],
    function () {
        Route::resource('guides', 'GuidesController', ['only' => ['index']]);
        Route::resource('guides/admin', 'AdminController', ['only' => ['index', 'edit']]);
    }
);

/app/Http/Middleware/Role.php

    public function handle($request, Closure $next, $role)
    {
        //  ['ADMIN', 'TEACHER']
    	$roles = func_get_args();
    	$roleIds = [];
        // 根据role名字拿到对应的id
		foreach ($roles as $index => $role) {
            // 为什么这么判断我也忘了
			if ($index < 2) continue;
			$roleIds[] = config('roles.' . trim($role));
		}

        // 判断当前用户的roleId是否存在
        if (! in_array((int)$this->auth->user()->RoleId, $roleIds)) {
            return response('Unauthorized', 403);
        }

        return $next($request);
    }

config/roles.php

return [
    /*
     * Role id for role.
     */
    'ADMIN'    => 1,
    'STUDENT'  => 2,
    'GUARDIAN' => 3,
    'TEACHER'  => 4,
    'SUPPORTSTAFF' => 5,
    'AUDITOR' => 6,
    'CURRICULUM' => 7,
    'CLIENTADMINISTRATOR' => 8,
];

在视图模板中初始化JS变量。

Sat, 13 Dec 2025 02:14:42 GMT

在视图模板中初始化JS变量。

<script>
    var app = <?php echo json_encode($array); ?>;
</script>

5.5以后可以这么写, 用 @json Blade 指令替代手动 json_encode

<script>
    var app = @json($array);
</script>

曾经在多语言项目中这么用过。

<script>
    window.Laravel = {
        csrfToken: '{{ csrf_token() }}',
        Locale: '<?php echo \App::getLocale(); ?>',
        Languages: <?php echo json_encode(
            [
                'scaffold'         => __('scaffold::t'),
                'module_dashboard' => __('module_dashboard::t'),
                'module_user' => __('module_user::t'),
                'setting' => __('setting::t'),
            ],
            JSON_PRETTY_PRINT | JSON_UNESCAPED_UNICODE);?>
    };
</script>

Laravel变量传入在vue组件中

定义组件

<script>
export default {
    props: ['surveyData'],
    mounted () {
        // Do something useful with the data in the template
        console.dir(this.surveyData)
    }
}
</script>

注入变量

<survey-component :survey-data="'{!! json_encode($surveyData) !!}'"></survey-component>

参考： https://medium.com/@m_ramsden/passing-data-from-laravel-to-vue-98b9d2a4bd23 https://laravel-china.org/docs/laravel/5.6/blade/1375

参考

Sat, 13 Dec 2025 02:14:42 GMT

MySQL5.7.8 起支持定义JSON类型

这里已经建了一张表，叫 my_json，注意 meta 是 json 类型

建立相关的模型

<?php
namespace Modules\Models;

use Illuminate\Database\Eloquent\Model;

class MyJson extends Model
{

    public $table = 'my_json';


    public $fillable = [
         'meta'
    ];

    /**
     * The attributes that should be casted to native types.
     *
     * @var  array
     */
    protected $casts = [
        'id'             => 'number',
        'meta'           => 'array',
    ];
}

操作

// 新增
$model = new MyJson();
$model->meta =['name' => 'jack', 'age' => 18];
$model->save();

// 更新
$result = MyJson::query()
  ->where('id', 1)
  ->update(['meta->name' => 'lily', 'meta->age' => 28]);


//  可以插入复杂些的内容
$model = new MyJson();
$model->meta =[
   'deviceInfo' => [
          [
            'name' => '消防栓',
            'fields' => [
                ['id' => 1, 'type' => '1', 'label' => '消火栓箱体外观无破损现象'],
                ['id' => 2, 'type' => '2', 'label' => '消火栓箱箱门正面有标志牌，标注“消火栓”字样'],
                ['id' => 3, 'type' => '1', 'label' => '消火栓箱门开启角度可大于160度']
            ]
          ],
          [
            'name' => '灭火器',
            'fields' => [
                ['id' => 1, 'type' => '1', 'label' => '灭火器外观无破损现象'],
                ['id' => 2, 'type' => '2', 'label' => '灭火器正面有标志牌'],
            ]
          ]
        ]
      ];
$model->save();

// 当然更新时候会稍微麻烦些
$model = MyJson::query()->find(4);
$tmp = $model->meta;
$tmp['deviceInfo'][0]['name'] = 'll';
$model->meta = $tmp;
$model->save();
$result = MyJson::query()->find(4)->meta;

存到数据库里会自动转为JSON

总结：使用 Laravel 操作 MySQL 的 json类型还是很方便的，主要是建立表时要考虑好

参考

https://www.cnblogs.com/wshenjin/p/10276678.html https://learnku.com/laravel/t/13185/in-depth-understanding-of-json-data-type-of-mysql-nosql-in-relational-database

Sat, 13 Dec 2025 02:14:42 GMT

方法一：

我们有时候想测试一段代码生产的 SQL 语句，比如: 我们想看 App\User::all(); 产生的 SQL 语句，我们简单在 routes.php 做个实验即可：

//app/Http/routes.php

Route::get('/test-sql', function() {
    DB::enableQueryLog();
    $user = App\User::all();
    return response()->json(DB::getQueryLog());
});

然后我们在浏览器打开 http://www.yousite.com/test-sql 即可看到 $user = User::all(); 所产生的 SQL 了。

[
    {
        query: "select * from `users` where `users`.`deleted_at` is null",
        bindings: [ ],
        time: 1.37
    }
]

参考：http://blog.csdn.net/leedaning/article/details/53792727

Sat, 13 Dec 2025 02:14:42 GMT

要点：

Laravel 有 2 种主要方式来实现用户授权：gates 和策略。
Gates 接受一个当前登录用户的实例作为第一个参数。并且接收可选参数，比如相关的Eloquent 模型。
用命令生成策略 php artisan make:policy PostPolicy --model=Post 带--model参数生成的内容包含CRUD方法
Gate用在模型和资源无关的地方，Policy正好相反。

<?php

namespace App\Policies;

use App\User;
use App\Post;
use Illuminate\Auth\Access\HandlesAuthorization;

class PostPolicy
{
    use HandlesAuthorization;

    /**
     * Determine whether the user can view the post.
     *
     * @param  \App\User  $user
     * @param  \App\Post  $post
     * @return mixed
     */
    public function view(User $user, Post $post)
    {
        //
    }

    /**
     * Determine whether the user can create posts.
     *
     * @param  \App\User  $user
     * @return mixed
     */
    public function create(User $user)
    {
        //
    }

    /**
     * Determine whether the user can update the post.
     *
     * @param  \App\User  $user
     * @param  \App\Post  $post
     * @return mixed
     */
    public function update(User $user, Post $post)
    {
        //
    }

    /**
     * Determine whether the user can delete the post.
     *
     * @param  \App\User  $user
     * @param  \App\Post  $post
     * @return mixed
     */
    public function delete(User $user, Post $post)
    {
        //
    }
}

操作流程:

新建Post表及Model文件 php artisan make:migrate create_posts_table php artisan make:model Post 表信息

    public function up()
    {
        Schema::create('posts', function (Blueprint $table) {
            $table->increments('id');
            $table->string('title');
            $table->integer('user_id')->unsigned();
            $table->text('body');
            $table->foreign('user_id')->references('id')->on('users')->onDelete('cascade');
            $table->timestamps();
        });
    }

填充数据，打开UserFactory添加

$factory->define(App\Post::class, function (Faker $faker) {
	return [
		'title' => $faker->sentence,
		'body' => $faker->paragraph,
		'user_id' => factory(\App\User::class)->create()->id,
	];
});

Post表内容

routes/web.php添加 Route::resource('posts', 'PostsController');
定义Gate 打开 Proviers/AuthServiceProvider.php，修改boot方法

    public function boot()
    {
        $this->registerPolicies();

        // Gates 接受一个用户实例作为第一个参数，并且可以接受可选参数，比如 相关的 Eloquent 模型：
	    Gate::define('update-post', function ($user, $post) {
		    // return $user->id == $post->user_id;
		    return $user->owns($post);
	    });
    }

这里，在User模型中定义了own方法

    public function owns($post)
    {
    	return $post->user_id === $this->id;
    }

PostsController中，只写一个show方法

    // Gate 演示
	public function show($id)
	{
		$post = Post::findOrFail($id);

		\Auth::loginUsingId(2);

		$this->authorize('update-post', $post);

		if (Gate::denies('update-post', $post)) {
			abort(403, 'sorry');
		}


		// compact('post') 等价于 ['post' => $post]
		return view('posts.view', compact('post'));
		// return $post->title;
	}

访问 /posts/1。会报403。这是因为我们是用user_id为2登录。

如果注释 $this->authorize('update-post', $post);，就会显示：
视图中判断Policy，如果post的user_id是当前登录用户，显示编辑链接。

@can('update', $post)
<a href="proxy.php?url=#">编辑</a>
@endcan

@can 和 @cannot 各自转化为如下声明：

@if (Auth::user()->can('update', $post))
    <!-- 当前用户可以更新博客 -->
@endif

@unless (Auth::user()->can('update', $post))
    <!-- 当前用户不可以更新博客 -->
@endunless

参考：https://d.laravel-china.org/docs/5.5/authorization

Sat, 13 Dec 2025 02:14:42 GMT

实现基于user，role，permission三表的权限管理因为一个用户可能拥有多种role，而一种role能同时被多个用户拥有。所以要建立多对多关系。参见文档

建立这三个表及关联表

    public function up()
    {
        Schema::create('roles', function (Blueprint $table) {
            $table->increments('id');
            $table->string('name');
            $table->string('label')->nullable();
            $table->timestamps();
        });

	    Schema::create('permissions', function (Blueprint $table) {
		    $table->increments('id');
		    $table->string('name');
		    $table->string('label')->nullable();
		    $table->timestamps();
	    });

	    Schema::create('permission_role', function (Blueprint $table) {
		    $table->integer('permission_id')->unsigned();
		    $table->integer('role_id')->unsigned();

		    $table->foreign('permission_id')
		          ->references('id')
		          ->on('permissions')
		          ->onDelete('cascade');

		    $table->foreign('role_id')
		          ->references('id')
		          ->on('roles')
		          ->onDelete('cascade');

		    $table->primary(['permission_id', 'role_id']);
	    });

	    Schema::create('role_user', function (Blueprint $table) {
		    $table->integer('role_id')->unsigned();
		    $table->integer('user_id')->unsigned();

		    $table->foreign('user_id')
		          ->references('id')
		          ->on('users')
		          ->onDelete('cascade');

		    $table->foreign('role_id')
		          ->references('id')
		          ->on('roles')
		          ->onDelete('cascade');

		    $table->primary(['user_id', 'role_id']);
	    });
    }

建立模型关联

User模型

...
	public function roles()
	{
		return $this->belongsToMany(Role::class);
	}
...

Role模型

class Role extends Model
{
	public function permissions()
	{
		return $this->belongsToMany(Permission::class);
	}

    // $role = Role::first(); $p = Permission::first();  
    // $role->givePermission($p);
	public function givePermission(Permission $permission)
	{
		return $this->permissions()->save($permission);
	}
}

Permission模型

class Permission extends Model
{
	public function roles()
	{
		return $this->belongsToMany(Role::class);
	}
}

添加记录，这里我们添加一个admin的role和名为edit_form的permission，并且让admin拥有edit_form权限。

执行完 $role->givePermission($permission);会发现permission_role表多了一条记录

添加role和user的关系，将id为1的用户角色修改为admin。

会发现role_user表多了一条记录

$user->roles()->detach($role); 可以删除这条记录 $user->roles()->attach($role); 新增记录

修改AuthServiceProvider.php，从数据库从读取所有的permission信息并设置Gate。让配置生效。

    public function boot()
    {
        $this->registerPolicies();

        // Gates 接受一个用户实例作为第一个参数，并且可以接受可选参数，比如 相关的 Eloquent 模型：
	    foreach($this->getPermission() as $permission) {
	    	// dd($permission->roles);
	    	Gate::define($permission->name, function($user) use ($permission) {
	    		// 返回collection
	    		return $user->hasRole($permission->roles);
		    });
	    }

    }

	public function getPermission()
	{
		return Permission::with('roles')->get();
    }

给User模型添加hasRole方法

	public function hasRole($role)
	{
		if (is_string($role)) {
			return $this->roles->contains('name', $role);
		}

		// intersect 移除任何指定 数组 或集合内所没有的数值。最终集合保存着原集合的键：
		return !!$role->intersect($this->roles)->count();
	}

修改视图，测试，如果当前登录用户的id是1，就可以看到'编辑'链接

@can('edit_form')
<a href="proxy.php?url=#">编辑</a>
@endcan

总结

$this->roles() 与 $this->roles 有什么不同，什么情况下使用呢？ $this->roles() 返回 QueryBuilder ，$this->roles 返回一个 Collection

Sat, 13 Dec 2025 02:14:42 GMT

$this->roles() 与 $this->roles 有什么不同，什么情况下使用呢？ $this->roles() 返回 QueryBuilder ，$this->roles 返回一个 Collection

Sat, 13 Dec 2025 02:14:42 GMT

本节新建一个全新的laravel5.4项目及为user表添加一些字段

新建laravel项目 laravel new zhihu-app
配置.env，主要改下数据库连接信息
配置vhost，如果用的homestead，可能还要改他的配置文件
修改user表打开 2014_10_12_000000_create_users_table.php 添加一些字段

  public function up()
  {
    Schema::create('users', function (Blueprint $table) {
      $table->increments('id');
      $table->string('name')->unique();
      $table->string('email')->unique();
      $table->string('password');
      $table->string('avatar');
      // 激活token
      $table->string('confirmation_token');
      // 是否激活邮箱
      $table->smallInteger('is_active')->default(0);
      $table->integer('questions_count')->default(0);
      $table->integer('answers_count')->default(0);
      $table->integer('comments_count')->default(0);
      $table->integer('favorites_count')->default(0);
      $table->integer('likes_count')->default(0);
      $table->integer('followers_count')->default(0);
      $table->integer('followings_count')->default(0);
      $table->string('api_token', 64)->unique();
      // 注意这里需要mysql5.7以上 支持json格式
      $table->json('settings')->nullable();
      $table->rememberToken();
      $table->timestamps();
    });
  }

执行 php artisan migrate 生成user table

Sat, 13 Dec 2025 02:14:42 GMT

注册流程：用户注册必须填写邮箱地址 -> 发送验证邮箱 -> 激活登录成功相关扩展： Laravel-SendCloud

Laravel是自带登录，忘记密码，找回密码等auth相关的逻辑的，执行 php artisan make:auth 就会多出来这些相关文件，具体参见。页面的右上角就能看到注册，登录的链接了。
配置邮箱，使用上面的Laravel-SendCloud
修改注册逻辑，修改 RegisterController.php 的create方法

	protected function create(array $data)
	{
		$user = User::create([
			'name' => $data['name'],
			'email' => $data['email'],
			// TODO 通过配置读取
			'avatar' => '/images/avatars/default.png',
			'confirmation_token' => str_random(40),
			'password' => bcrypt($data['password']),
			'api_token' => str_random(60),
			'settings' => ['city' => '']
		]);
        // 发送激活邮件
		$this->sendVerifyEmailToUser($user);
        \Flash::success('一封激活邮件已发送到 '.$data['email'].' 请激活');
		return $user;
	}

Sat, 13 Dec 2025 02:14:42 GMT

安装 https://github.com/laracasts/flash 该扩展用于方便的输出提示信息
复写登录逻辑，因为给user表新增了is_active字段打开 \app\Http\Controllers\Auth\LoginController.php 大致添加如下：

php

    /**
     * Handle a login request to the application.
     *
     * @param  \Illuminate\Http\Request  $request
     * @return \Illuminate\Http\RedirectResponse|\Illuminate\Http\Response
     */
    public function login(Request $request)
    {
        $this->validateLogin($request);

        // If the class is using the ThrottlesLogins trait, we can automatically throttle
        // the login attempts for this application. We'll key this by the username and
        // the IP address of the client making these requests into this application.
        if ($this->hasTooManyLoginAttempts($request)) {
            $this->fireLockoutEvent($request);

            return $this->sendLockoutResponse($request);
        }

        if ($this->attemptLogin($request)) {
            Flash::success('登录成功!');
            return $this->sendLoginResponse($request);
        }

        // If the login attempt was unsuccessful we will increment the number of attempts
        // to login and redirect the user back to the login form. Of course, when this
        // user surpasses their maximum number of attempts they will get locked out.
        $this->incrementLoginAttempts($request);

        return $this->sendFailedLoginResponse($request);
    }

    /**
     * Attempt to log the user into the application.
     *
     * @param  \Illuminate\Http\Request  $request
     * @return bool
     */
    protected function attemptLogin(Request $request)
    {
        $credentials = array_merge($this->credentials($request), ['is_active' => 1]);
        return $this->guard()->attempt(
            $credentials, $request->has('remember')
        );
    }

Sat, 13 Dec 2025 02:14:42 GMT

扩展： https://github.com/caouecs/laravel-lang https://github.com/overtrue/laravel-lang

默认下Laravel装好后使用的是英文错误消息也是英文的，如要翻译成中文其实非常简单。复制/resouces/lang/en目录，在同级粘贴重命名为zh。目录下有4个文件auth.php，validation.php等。你不用一个个翻译成中文，这里有翻译好的，直接覆盖就可以了。

Sat, 13 Dec 2025 02:14:42 GMT

添加某些地址不受CSRF中间件验证 app/Http/Middleware/VerifyCsrfToken.php

Sat, 13 Dec 2025 02:14:42 GMT

php artisan make:model --help

Sat, 13 Dec 2025 02:14:42 GMT

nginx每个location都是一个匹配目录 nginx的策略是：访问请求来时，会对访问地址进行解析，从上到下逐个匹配，匹配上就执行对应location大括号中的策略，并根据策略对请求作出相应。

总结 location目录后加"/",只能匹配目录，不加“/”不仅可以匹配目录还对目录进行模糊匹配。

而proxy_pass无论加不加“/”,代理跳转地址都直接拼接。为了加深大家印象可以用下面的配置实验测试下：

server {   
  listen       80;   
  server_name  localhost;   

  # http://localhost/wddd01/xxx -> http://localhost:8080/wddd01/xxx
  location /wddd01/ {           
    proxy_pass http://localhost:8080;   
  }

  # http://localhost/wddd02/xxx -> http://localhost:8080/xxx   
  location /wddd02/ {           
    proxy_pass http://localhost:8080/;    
  }

  # http://localhost/wddd03/xxx -> http://localhost:8080/wddd03*/xxx   
  location /wddd03 {           
    proxy_pass http://localhost:8080;   
  }

  # http://localhost/wddd04/xxx -> http://localhost:8080//xxx，请注意这里的双斜线，好好分析一下。
  location /wddd04 {           
    proxy_pass http://localhost:8080/;   
  }

  # http://localhost/wddd05/xxx -> http://localhost:8080/hahaxxx，请注意这里的haha和xxx之间没有斜杠，分析一下原因。
  location /wddd05/ {           
    proxy_pass http://localhost:8080/haha;    
  }

  # http://localhost/api6/xxx -> http://localhost:8080/haha/xxx   
  location /wddd06/ {           
    proxy_pass http://localhost:8080/haha/;   
  }

  # http://localhost/wddd07/xxx -> http://localhost:8080/haha/xxx   
  location /wddd07 {           
    proxy_pass http://localhost:8080/haha;   
  } 
        
  # http://localhost/wddd08/xxx -> http://localhost:8080/haha//xxx，请注意这里的双斜杠。
  location /wddd08 {           
    proxy_pass http://localhost:8080/haha/;   
  }
}

参考

Sat, 13 Dec 2025 02:14:42 GMT

这里我已经拥有了一个example.com域名，要生成这个域名的泛域名证书，又不想掏钱买，可以使用Let’s Encrypt

Let’s Encrypt 是一个非盈利的 CA 机构，目的是推动https的发展。他们搞了一个非常有创意的事情，设计了一个 ACME 协议。那为什么要创建 ACME 协议呢，传统的 CA 机构是人工受理证书申请、证书更新、证书撤销，完全是手动处理的。而 ACME 协议规范化了证书申请、更新、撤销等流程，只要一个客户端实现了该协议的功能，通过客户端就可以向 Let’s Encrypt 申请证书，也就是说 Let’s Encrypt CA 完全是自动化操作的。任何人都可以基于 ACME 协议实现一个客户端，官方推荐的客户端是Certbot 。 Let’s Encrypt 支持两种证书，单域名和泛域名为防止滥用，申请 Let’s Encrypt 证书的时候，需要校验域名的所有权，目前支持多种验证方式。常见的是dns01：给域名添加一个 DNS TXT 记录

Certbot是可以生成的https证书的工具，要使用他，你需要保证：

懂一些命令行
一个http访问的站点，即已经安装并运行了服务器
80端口是开放的
可以通过SSH访问服务器
可以使用sudo 如果要配置泛域名证书，还需要知道域名的DNS提供商，并且可以修改DNS信息

安装 certbot

打开 https://certbot.eff.org/

选择你的服务器和操作系统，这里我选择Nginx服务器和Ubuntu18.04版本的操作系统接着让你选择生成默认证书（单一域名）还是通配（泛域名）证书这里我选择泛域名

bash

sudo apt-get install software-properties-common
sudo add-apt-repository universe
sudo add-apt-repository ppa:certbot/certbot
sudo apt-get update
sudo apt-get install certbot

生成证书 sudo certbot --server https://acme-v02.api.letsencrypt.org/directory -d *.example.com -d example.com --manual --preferred-challenges dns-01 certonly --agree-tos --manual-public-ip-logging-ok

修改example.com为实际的域名

会提示 ` Please deploy a DNS TXT record under the name _acme-challenge.example.com with the following value:

CqlWZaGWFSC1sj7Jww2juz9VJIzzJwWWoo-WUu-1Dow `

这时候需要去域名DNS管理后台添加相应记录，不要着急next回车，因为DNS生效可能要等5-10分钟回车后，如果出现

` IMPORTANT NOTES:

Congratulations! Your certificate and chain have been saved at: /etc/letsencrypt/live/example.com/fullchain.pem Your key file has been saved at: /etc/letsencrypt/live/example.com/privkey.pem Your cert will expire on 2020-12-28. To obtain a new or tweaked version of this certificate in the future, simply run certbot again. To non-interactively renew all of your certificates, run "certbot renew"
If you like Certbot, please consider supporting our work by:

Donating to ISRG / Let's Encrypt: https://letsencrypt.org/donate Donating to EFF: https://eff.org/donate-le `

修改nginx配置，可以参考下面的配置，我的网站需要跑PHP

server {

    root /var/html/www;

	# Add index.php to the list if you are using PHP
	index index.php index.html index.htm index.nginx-debian.html;

    # 修改为泛域名
	server_name *.example.com;

	location / {
		# First attempt to serve request as file, then
		# as directory, then fall back to displaying a 404.
		# try_files $uri $uri/ =404;
		try_files $uri $uri/ /index.php?$query_string;
	}

    location = /favicon.ico { access_log off; log_not_found off; }
    location = /robots.txt  { access_log off; log_not_found off; }

	error_page 404 /index.php;

	# pass PHP scripts to FastCGI server
	#
	location ~ \.php$ {
		include snippets/fastcgi-php.conf;
	#
	#	# With php-fpm (or other unix sockets):
		fastcgi_pass unix:/var/run/php/php7.2-fpm.sock;
	#	# With php-cgi (or other tcp sockets):
	#	fastcgi_pass 127.0.0.1:9000;
	}

    listen [::]:443 ssl ipv6only=on; # managed by Certbot
    listen 443 ssl; # managed by Certbot
    # 注意路径，改为刚才生成后显示的
    ssl_certificate /etc/letsencrypt/live/example.com/fullchain.pem; # managed by Certbot
    ssl_certificate_key /etc/letsencrypt/live/example.com/privkey.pem; # managed by Certbot
    include /etc/letsencrypt/options-ssl-nginx.conf; # managed by Certbot
    ssl_dhparam /etc/letsencrypt/ssl-dhparams.pem; # managed by Certbot

}

server {
    # http 转 https重定向
	rewrite ^(.*) https://$host$1 permanent;
	listen 80 default_server;
	listen [::]:80 default_server;

	server_name *.course.intogolf.nl;
    return 404; # managed by Certbot
}

sudo nginx -t 检查配置，无误后 sudo nginx -s reload
letsencrypt的证书有效期是三个月，可设置crontab自动任务进行更新

30 1 10 * * /usr/bin/certbot renew && /usr/sbin/nginx -s reload # 每月10日1点30分执行一次

先which certbot确定certbot实际的位置

参考

https://certbot.eff.org/lets-encrypt/ubuntubionic-nginx

https://blog.csdn.net/zcyuefan/article/details/82986844

https://www.jianshu.com/p/c6f6f277a23d

覆盖发布和非覆盖发布的区别

Sat, 13 Dec 2025 02:14:42 GMT

nginx-的静态文件缓存策略.md

覆盖发布和非覆盖发布的区别

覆盖发布：前端项目打包后每次产生相同的文件名，发布至服务器时，同名文件直接替换，新文件添加。
非覆盖式发布：采用更新文件名的形式，比如采用webpack的[id].[chunkhash].js的形式，这样更新文件后，新文件不会影响旧文件的存在。

覆盖式发布的缺点：

先更新页面再更新静态资源新页面里加载旧的资源，页面和资源对应不上，会有页面混乱，还有执行会报错。先更新静态资源再更新页面在静态资源更新完成，页面没有被更新过程中，有缓存的用户是正常的。这个时候读本地的缓存，但是如果没有缓存的用户会怎样？依然是会页面混乱和执行错误，因为在旧的页面加载新资源。

无论如何，覆盖式发布都是能被用户感知到的，所以部分公司的发布是晚上上线。其中如果使用vue-cli直接生成webpack配置打包的话，直接发布dist文件夹下资源就会产生这种特殊的替换问题，因为在build.js文件中存在这么一行代码，初衷应该是防止dist文件夹越来越大，但是rimraf模块会递归删除目录所有文件，没有详细了解过vue-cli生成编译环境的人，就默认的采用了这种旧资源删除新资源生成。

// build.js
rm(path.join(config.build.assetsRoot, config.build.assetsSubDirectory), err => {
    ...
})

接下来讲了下，我更新的发布模式。

nginx的静态文件缓存策略

静态资源html不使用缓存，每次加载均从服务器中拉取最新的html文件静态资源js/css/图片资源，采取强缓存策略，这个时间可以尽可能的长一些，因为是非覆盖式发布，所以如果html中加载资源URI更新，那么资源也会统一的更新

nginx可以对不同文件进行不同的缓存策略，大致配置如下（需要注意location匹配的优先级）：

location ~ .*\.(?:jpg|jpeg|gif|png|ico|cur|gz|svg|svgz|mp4|ogg|ogv|webm)$
{
    expires      7d;
}

location ~ .*\.(?:js|css)$
{
    expires      7d;
}

location ~ .*\.(?:htm|html)$
{
    add_header Cache-Control "private, no-store, no-cache, must-revalidate, proxy-revalidate";
}

然后发布的时候先将除html文件移动至发布路径，同名文件默认跳过，新生成的文件会产生新的hash，新旧文件不会冲突，共存在发布路径。 html文件的更新当时做了两种方案

html完全由前端管理，前端发布的时候会有html文件，webpack打包时自动在html里写文件名；
html由后端管理（服务器渲染），前端只负责发布js、css等资源文件。在前端发布之后，后端修改版本号再发布；

Sat, 13 Dec 2025 02:14:42 GMT

今天，配置nginx反向代理时遇到一个问题，当设置nginx监听80端口时转发请求没有问题。

但一旦设置为监听其他端口，就一直跳转不正常；如，访问欢迎页面时应该是重定向到登录页面，在这个重定向的过程中端口丢失了。这里给出一个简短的解决方案，修改nginx的配置文件。

一、配置文件

    server {
        listen       90;
        server_name  zxy1994.cn;
        proxy_set_header X-Forwarded-Host $host;
        proxy_set_header X-Forwarded-Server $host;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header Host $host:$server_port; # 这里是重点,这样配置才不会丢失端口
        location / {
                proxy_pass http://127.0.0.1:9001;
        }
        location = /50x.html {
            root   html;
        }
    }

二、产生的原因

nginx没有正确的把端口信息传送到后端，没能正确的配置nginx，下面这行是关键 proxy_set_header Host $host:$server_port; 这一行是关键。

中间件的写法

Sat, 13 Dec 2025 02:14:42 GMT

Express号称web框架，我不以为然，我理解的框架应该包含很多东西，Express的核心思想是中间件。你需要什么功能搜相应的中间件就可以了。

中间件的写法

支持 callback1,callback2、[callback1, callback2]、function callback(req, res, next) 或混合写法

function cb1(req, res, next) {
  console.log('--cb1--');
  next();
}

function cb2(req, res, next) {
  console.log('--cb2--');
  next();
}

app.get('/',
  cb1, [cb2],
  (req, res, next) => {
    console.log('--cb3--');
    next();
  },
  (req, res, next) => {
  res.send('hello');
});

middleware之间传值

使用 res.locals.key=value;

app.use(function(req, res, next) {
    res.locals.user = req.user;  
    res.locals.authenticated = ! req.user.anonymous;
    next();
});

传给下一个

app.use(function(req, res, next) {
    if (res.locals.authenticated) {
        console.log(res.locals.user.id);
    }
    next();
});

表单提交及json格式提交

var express = require('express');
var app = express();
var bodyParser = require('body-parser');

// 支持解析json格式
app.use(bodyParser.json());

// 支持解析 application/x-www-form-urlencoded 编码，就是表单提交
var urlencodedParser = bodyParser.urlencoded({ extended: false })

// 这个urlencodedParser必须带，不然 request.body 为 undefined
app.post('/', urlencodedParser, function(request, response) {
    console.dir(request.body);
      response.send('It works');
    }
});

不带 app.use(bodyParser.json()); 不支持下面的提交也就是 Content-Type: application/json
带 var urlencodedParser = bodyParser.urlencoded({ extended: false })

参考： http://expressjs.com/en/resources/middleware/body-parser.html

* module.exports 与 exports 的区别

Sat, 13 Dec 2025 02:14:42 GMT

Node 单线程，远离多线程死锁，状态同步等问题。
利用异步io，让单线程远离阻塞，以更好的充分利用cpu。需要强调，这里得单线程仅仅是JS执行在单线程罢了。在node中，无论是*nix还是Windows平台，内部完成io任务的另有线程池。
Node的循环机制，启动时又一个死循环，每执行一次循环体称为Tick。每次循环处理事件。如果事件存在回调则处理回调。接着处理下一个事件。
在Node中，事件来源有网络请求，文件io等。

事件循环时典型的生产者/消费者模型，异步io，网络请求是生产者，源源不断等为node提供不同的事件，这次事件被传递导对应的观察者那里，事件循环则从观察者那里取出事件并处理

Node8起新增了 util.promisify() 方法，可以快捷的把原来的异步回调方法改成返回 Promise 实例。

举例1

const util = require('util');
const fs = require('fs');
const readFileAsync = util.promisify(fs.readFile);
fileResult = await readFileAsync(sourcePathFile);

举例2

/**
* 执行 shell 返回 Promise
*/
async function execShell(scriptPath) {
  const execFile = require('util').promisify(require('child_process').execFile);
  return await execFile('sh', [scriptPath]);
}

module.exports 与 exports 的区别先看下面的例子

**test.js**

var a = {name: 1}; 
var b = a;

console.log(a); 
console.log(b);

b.name = 2; 
console.log(a); 
console.log(b);

var b = {name: 3}; 
console.log(a); 
console.log(b);

运行 test.js 结果为：

{ name: 1 } 
{ name: 1 } 
{ name: 2 } 
{ name: 2 } 
{ name: 2 } 
{ name: 3 }

解释：a 是一个对象，b 是对 a 的引用，即 a 和 b 指向同一块内存，所以前两个输出一样。当对 b 作修改时，即 a 和 b 指向同一块内存地址的内容发生了改变，所以 a 也会体现出来，所以第三四个输出一样。当 b 被覆盖时，b 指向了一块新的内存，a 还是指向原来的内存，所以最后两个输出不一样。

同理 exports 是 module.exports 的引用。当 module.exports 属性被一个新的对象完全替代时，也会重新赋值 exports 如果你觉得用不好可以只使用module.exports

Event Loop

event loop是一个执行模型，在不同的地方有不同的实现。浏览器和NodeJS基于不同的技术实现了各自的 Event Loop。可以简单理解为不断执行的死循环浏览器的Event Loop是在 html5 的规范中明确定义。 NodeJS的Event Loop是基于libuv实现的。可以参考 Node 的官方文档以及 libuv 的官方文档。 libuv已经对Event Loop做出了实现，而HTML5规范中只是定义了浏览器中Event Loop的模型，具体的实现留给了浏览器厂商。

Events

Events 是 Node.js 中一个非常重要的 core 模块, 在 node 中有许多重要的 core API 都是依赖其建立的. 比如 Stream 是基于 Events 实现的, 而 fs, net, http 等模块都依赖 Stream, 所以 Events 模块的重要性可见一斑。

通过继承 EventEmitter 来使得一个类具有 node 提供的基本的 event 方法, 这样的对象可以称作 emitter，而触发(emit)事件的 cb 则称作 listener。与前端 DOM 树上的事件并不相同, emitter 的触发不存在冒泡, 逐层捕获等事件行为, 也没有处理事件传递的方法。

Node.js 中 Eventemitter 的 emit 是同步的。

例1：

const EventEmitter = require('events');
let emitter = new EventEmitter();

emitter.on('myEvent', () => {
  console.log('1');
});
emitter.on('myEvent', () => {
  console.log('2');
});
emitter.emit('myEvent');

执行结果是 1， 2

例2：会发生死循环

const EventEmitter = require('events');
let emitter = new EventEmitter();

emitter.on('myEvent', () => {
  console.log('hi');
  emitter.emit('myEvent');
});

// 只出现一次
console.log("1")

emitter.emit('myEvent');

// 永远不会发生
console.log("down")

例3 在使用node的mongoose模块中，项目中有如下代码：如何实现的呢？

const mongoose = require('mongoose');
// MongoDB connect
function mongoDBConnect() {
  mongoose.connect(`${config.mongo.url}${config.mongo.database}`);
  return mongoose.connection;
}

mongoDBConnect()
  .on('error', console.error.bind(console, 'connection error:'))
  .on('disconnected', () => console.log('mongodb disconnected'))
  .once('open', () => console.log('mongodb connection successful'));

翻了源码最关键的一行是让Connection继承自EventEmitter。 Connection.prototype.__proto__ = EventEmitter.prototype;

const EventEmitter = require('events').EventEmitter;

// connectionState start
const STATES = Object.create(null);

const disconnected = 'disconnected';
const connected = 'connected';
const connecting = 'connecting';

STATES[0] = disconnected;
STATES[1] = connected;
STATES[2] = connecting;

STATES[disconnected] = 0;
STATES[connected] = 1;
STATES[connecting] = 2;
// connectionState end


function Connection() {
	this.states = STATES;
	this._readyState = STATES.disconnected;
}

// 这行非常关键，继承 EventEmitter
Connection.prototype.__proto__ = EventEmitter.prototype;

Object.defineProperty(Connection.prototype, 'readyState', {
  get: function() {
    return this._readyState;
  },
  set: function(val) {
    if (!(val in STATES)) {
      throw new Error('Invalid connection state: ' + val);
    }

    if (this._readyState !== val) {
      this._readyState = val;

      this.emit(STATES[val]);
    }
  }
});

Connection.prototype.onOpen = function() {
  this.readyState = STATES.connected;
  this.emit('open');
};

let conn = new Connection();

conn.on('connected', () => {
	console.log("1");
});

conn.on('open', () => {
	console.log("open!!");
});


conn.readyState = 1

conn.readyState = 2

conn.onOpen();

pm2 reload 和pm2 restart 有啥区别

Sat, 13 Dec 2025 02:14:42 GMT

2018-04-12 更新pm2的权限问题

PM2 的功能不多做介绍了，总之使用简单，功能强大。今天实现了本地自动部署node项目到服务器的流程。简单总结下几个注意点。建议先看文档

先要保证要部署的服务器上(以下简称server)能直接ssh拉仓库代码，比如 git clone [email protected]:finley/demo.git。不行的话配下server生成ssh-key，然后把public key存到代码仓库服务商，比如coding.net, github。
权限问题，比如服务器的登录用户是ubuntu，将来项目要部署在/home/ubuntu下面，可以执行下 sudo chown ubuntu:ubuntu /home/ubuntu/.pm2/* 不然可能会部署失败。
部署成功后会在配置的项目路径里出现以下三个目录：

current -- 当前服务运行的文件夹(是source的软链接) share -- log pid 等共享数据 source -- clone 下来的源代码

配置脚本

module.exports = {
  /**
   * Application configuration section
   * http://pm2.keymetrics.io/docs/usage/application-declaration/
   */
  apps : [
    {
      name      : 'NODE-API',
      script    : 'server.js',
      // 这里是公共变量
      env: {
          SERVER_PORT: 8081,
      },
      env_development: {
        NODE_ENV: 'development',
      },
      env_production : {
        NODE_ENV: 'production',
      }
    }
  ],

  /**
   * Deployment section
   * http://pm2.keymetrics.io/docs/usage/deployment/
   */
  deploy : {
    // 项目信息
    // 下面的配置是我用什么用户登录哪个服务器，从哪拉代码，项目存到什么位置。拉完执行的脚本是啥
    'master' : {
      user : 'ubuntu',
      // 写成数组，可以同时部署到多台服务器
      host : '119.254.xxx.xxx',
      ref  : 'origin/master',
      repo : 'ssh://[email protected]/demo.git',
      // 项目的存放地址，会生成current, source, share目录
      path : '/home/ubuntu/node-project',
      // "ssh_options": ["StrictHostKeyChecking=no", "PasswordAuthentication=no"],
      "post-deploy" : 'npm install && pm2 startOrRestart ecosystem.config.js --env production'
    }
  }
};

执行命令, 如果是windows，在CMD中执行没用，建议在 git bash下执行。先初始化下，这里会尝试远程登录服务器并建立项目目录，如果失败通常是ssh问题。所以先在服务器上试试git clone能否成功，如果拉不下来，考虑服务器防火墙限制或ssh配置 pm2 deploy ecosystem.config.js master setup 这个命令只是拉仓库代码 pm2 deploy ecosystem.config.js master 这个命令会执行配置文件的 post-deploy 部分，最终运行项目

pm2 reload 和pm2 restart 有啥区别

官方说明：As opposed to restart, which kills and restarts the process, reload achieves a 0-second-downtime reload. 简单理解： restart = stop+start reload 会更优雅一些具体用哪个要根据项目运行实际情况，有些项目需要7*24运行，不得stop，这时候用reload比较好。

权限问题

使用 sudo pm2 start ecosystem.config.js 和 pm2 start ecosystem.config.js 启动项目是有区别的，前者用户可能是root，后者是当前用户。建议不加sudo启动。我们在服务器上操作pm2 list, pm2 logs非常频繁。如果非得加sudo和密码才能成功。可以 sudo visudo 然后追加ubuntu ALL=(ALL) NOPASSWD:ALL ubuntu 是不希望输入密码的用户名。

记录请求参数和请求内容

Sat, 13 Dec 2025 02:14:42 GMT

记录请求参数和请求内容

默认morgan没有提供记录请求参数和请求内容的方法，但是他提供了扩展方法，如下：

morgan.token('requestParameters', function(req, res){
  return JSON.stringify(req.query) || '-';
});

morgan.token('requestBody', function(req, res){
  return JSON.stringify(req.body) || '-';
});

// create custom format，includes the custom token
morgan.format('live-api', ':method :url :status :requestParameters :requestBody');

app.use(morgan('live-api'));

输出日志到数据库或将日志作为参数发送到其他请求

默认日志信息是输出到命令行窗口中，能否输出到文件或数据库中呢？答案是肯定的定义morgan的options中有个stream配置项，我们可以利用他做文章。

const request = require('request')
const split = require('split')

// 将日志信息作为请求参数传给其他地址，比如 Elasticsearch 日志分析系统
let httpLogStream = split().on('data', function (line) {
  request({
    url: 'localhost://192.168.1.1:8080',
    method: 'POST',
    body: line
  })
  .on('response', function(response) {
    console.log(response.statusCode) // 200
  })
});

app.use(morgan('common', {
  stream: httpLogStream
}));


// 将日志写入数据库
// 带write方法的对象
let dbStream = {
  write: function(line){
    saveToDatabase(line);  // 伪代码，保存到数据库
  }
};

// 将 dbStream 作为 stream 配置项的值
app.use(morgan('short', {stream: dbStream}));

Sat, 13 Dec 2025 02:14:42 GMT

避免写 node-modules/.bin/mocha --version, npx 的原理很简单，就是运行的时候，会到node_modules/.bin路径和环境变量$PATH里面，检查命令是否存在。
避免全局安装模块，如npx create-react-app my-react-app

参考： https://www.npmjs.com/package/npx

http://www.ruanyifeng.com/blog/2019/02/npx.html

1. 说说 PSR规范 (PHP Standard Recommendations)

Sat, 13 Dec 2025 02:14:42 GMT

作为一名专业的PHP开发人员，一定要懂得流行的技术规范，如果连规范都不知道，怎么能保证写出规范的代码呢？

1. 说说 PSR规范 (PHP Standard Recommendations)

https://learnku.com/docs/psr，比较重要的规范是PSR-4 自动加载规范

2. new static() 和 new self() 的区别

两个都是new对象

他们的区别只有在继承中才能体现出来，如果没有任何继承，那么这两者是没有区别的。
new self()返回的实例是万年不变的，无论谁去调用，都返回同一个类的实例，而new static()则是由调用者决定的。

php

class Father {
    public function getNewFather() {
        return new self();
    }

    public function getNewCaller() {
        return new static();
    }
}

class Sun1 extends Father {
}

class Sun2 extends Father {
}

$sun1 = new Sun1();
$sun2 = new Sun2();

// Father
print get_class($sun1->getNewFather());
// Sun1
print get_class($sun1->getNewCaller());
// Father
print get_class($sun2->getNewFather());
// Sun2
print get_class($sun2->getNewCaller());

get_class()方法是用于获取实例所属的类名。

3. ...可变数量

php

<?php
function sum(...$numbers) {
    $acc = 0;
    foreach ($numbers as $n) {
        $acc += $n;
    }
    return $acc;
}

echo sum(1, 2, 3, 4);

echo sum(1,2,3,4,5,6)

4. 兼容数组和多参数的写法

这是Laravel文件系统中删除文件方法的源码如果删除多个文件，可以传数组或多个参数

php

    public function delete($paths)
    {
        $paths = is_array($paths) ? $paths : func_get_args();

        $success = true;

        foreach ($paths as $path) {
            try {
                if (! @unlink($path)) {
                    $success = false;
                }
            } catch (ErrorException $e) {
                $success = false;
            }
        }

        return $success;
    }

总结：该函数接受可变数量的参数。参数将作为数组传递给给定变量

7.2 之后要注意的地方

Sat, 13 Dec 2025 02:14:42 GMT

标量类型声明

function setAge(int $age) {
  var_dump($age);
}
// 要求传入参数是整型
// echo setAge('dwdw');
// Fatal error: Uncaught TypeError: Argument 1 passed to setAge() must be of the type integer, string given...
// 注意这么写不会报错
echo setAge('1');

返回值类型声明

class User {}

function getUser() : array {
  return new User;
}
// Fatal error: Uncaught TypeError: Return value of getUser() must be of the type array, object returned
var_dump(getUser());
// 改成下面不会报错
function getUser() : User {
  return new User;
}

// 如果返回的类型不对
function getUser() : User {
	return [];
}
// 会报
// Fatal error: Uncaught TypeError: Return value of getUser() must be an instance of User, array returned 


// 再来个interface的例子, 执行下面的不会报错
interface SomeInterFace {
	public function getUser() : User;
}

class User {}

class SomeClass implements SomeInterFace {
	public function getUser() : User {
		return [];
	}
}
// 但是当调用的时候才会检查返回类型
// Fatal error: Uncaught TypeError: Return value of SomeClass::getUser() must be an instance of User, array returned
(new SomeClass)->getUser();

太空船操作符(组合比较符）

太空船操作符用于比较两个表达式。当$a小于、等于或大于$b时它分别返回-1、0或1

// Integers
echo 1 <=> 1; // 0
echo 1 <=> 2; // -1
echo 2 <=> 1; // 1

// 在usort自定义排序方法中很好用

$arr = ['c', 'd', 'b', 'a'];
// ['a', 'b', 'c', 'd']
usort($arr, function($a, $b) {
  return $a <=> $b;
});

Null合并运算符

PHP7之前： isset($_GET['id']) ? $_GET['id'] : 'err'; PHP7之后： $_GET['id'] ?? 'err';

use 批量声明

PHP7之前：

use App\Model\User;
use App\Model\Cart;
use App\Model\Base\BaseUser;

PHP7之后：

use App\Model\{
  User,
  Cart,
  Base\BaseUser
};

匿名类

php

class SomeClass {}
interface SomeInterface {}
trait SomeTrait {}

var_dump(new class(10) extends SomeClass implements SomeInterface {
    private $num;

    public function __construct($num)
    {
        $this->num = $num;
    }

    use SomeTrait;
});
// 输出
object(class@anonymous)[1]
  private 'num' => int 10

7.2 之后要注意的地方

each 函数在php7.2已经设定为过时

php

<?php
$b = array();
each($b);

// Deprecated:  The each() function is deprecated. This message will be suppressed on further calls

兼容方法

php

function fun_adm_each(&$array){
   $res = array();
   $key = key($array);
   if($key !== null){
       next($array); 
       $res[1] = $res['value'] = $array[$key];
       $res[0] = $res['key'] = $key;
   }else{
       $res = false;
   }
   return $res;
}

count 函数在php7.2将严格执行类型区分. 不正确的类型传入, 会引发一段警告.
count方法使用非常广泛，升级7.2后多注意测试。

<?php

count('');

// Warning:  count(): Parameter must be an array or an object that implements Countable

兼容方法

php

function fun_adm_count($array_or_countable,$mode = COUNT_NORMAL){
    if(is_array($array_or_countable) || is_object($array_or_countable)){
        return count($array_or_countable, $mode);
    }else{
        return 0;
    }
}

create_function创建匿名方法不鼓励使用。

参考：

https://laracasts.com/series/php7-up-and-running http://php.net/manual/zh/language.oop5.anonymous.php https://www.cnblogs.com/phpnew/p/7991572.html

Sat, 13 Dec 2025 02:14:42 GMT

我们首先来了解下PHP是如何工作的，PHP作为应用服务器时，目前普遍使用的是多进程工作模式，Web服务器Apache/Nginx通过FastCGI协议把请求转发到PHP-FPM进程。下面就来分析一个Web请求生命的全过程（如图7-1所示）。

假设用户在浏览器地址栏输入http://www.test.com/index.php发起一个请求，然后：

域名被DNS解析到Nginx管理进程（Master process）所在的服务器IP。
Nginx管理进程选择一个工作进程（Worker process）。
Nginx工作进程把请求转发到PHP-FPM管理进程（默认是9000端口）。
PHP-FPM管理进程分配一个工作进程处理index.php请求。
工作进程在服务器路径中找到index.php文件，解析编译。
执行PHP代码，可能还要请求后端存储等。

得到请求的结果，先返回给Nginx，然后再返回给用户浏览器。PHP-FPM管理进程不仅要负责分配PHP请求给工作进程，同时也要控制工作进程的创建、结束和启停。单个PHP工作进程服务完若干个请求后会结束进程，释放资源，管理进程再启动新的工作进程。 PHP多进程模式中内存等资源管理将由工作进程自行分配，满足一定的条件后重启工作进程会自动释放内存，即使内存泄漏也不会造成严重的问题，也不会出现多线程死锁的问题。所以PHP的可靠性较高，系统运行也更稳定，多进程需要不断地分配和回收进程资源，且需要消耗比线程模式更多的资源。多进程在大规模集群下的可扩展性很好，只需要简单地增加机器或增加进程即可实现扩展。

Sat, 13 Dec 2025 02:14:42 GMT

先看官方文档
在config.yml 添加 filter

    orm:
        entity_managers:
            default:
                filters:
                    softdeleteable:
                        class: Gedmo\SoftDeleteable\Filter\SoftDeleteableFilter
                        enabled: true

并且在最下面的启用

stof_doctrine_extensions:
    orm:
        default:
            softdeleteable: true

修改要使用软删除功能的setting 在Class上头添加

use Gedmo\Mapping\Annotation as Gedmo;
@Gedmo\SoftDeleteable(fieldName="deleted_at", timeAware=false)/

然后配置字段, 注意字段名要一致

    /**
     * @ORM\Column(type="datetime", nullable=true)
     */
    private $deleted_at;

参考： https://symfony.com/doc/master/bundles/StofDoctrineExtensionsBundle/index.html https://www.cnblogs.com/wlemory/p/5224482.html

Sat, 13 Dec 2025 02:14:42 GMT

在插入和更新数据表时要实现 create_at, update_at 字段的自动更新，一般框架都有这个功能。

Symfony中一般有两种方法：

使用 doctrine 的事件机制
使用 doctrine-extensions-bundle 类库提供的 timestampable 功能。

第一种，比较麻烦你需要在每个entity文件中定义时间类型的set，get方法还有，调用PrePersist 和 PreUpdate 生命周期钩子的方法。例子如下：

<?php

namespace Finley\BlogBundle\Entity;
use Doctrine\ORM\Mapping as ORM;

/**
 * Setting
 *
 * @ORM\Table(name="setting")
 * @ORM\Entity(repositoryClass="Finley\BlogBundle\Repository\SettingRepository")
*  不要忘了这行, 表示启用声明周期钩子
 * @ORM\HasLifecycleCallbacks
 */
class Setting
{
    /**
     * @var int
     *
     * @ORM\Column(name="id", type="integer")
     * @ORM\Id
     * @ORM\GeneratedValue(strategy="AUTO")
     */
    private $id;

    /**
     * @var \DateTime $created
     *
     * @ORM\Column(type="datetime", nullable=true)
     */
    private $created;

    /**
     * @var \DateTime $updated

     */
    private $updated;

    public function setCreated($created)
    {
        $this->created = $created;
        return $this;
    }

    public function getCreated()
    {
        return $this->created;
    }


    public function getUpdated()
    {
        return $this->updated;
    }

    public function setUpdated($updated)
    {
        $this->updated = $updated;
        return $this;
    }

    /**
     * 自动更新时间类型，不要忘了在 Class 上面加注解 ORM\HasLifecycleCallbacks
     *
     * @ORM\PrePersist
     * @ORM\PreUpdate
     */
    public function updatedTimestamps()
    {
        $this->setUpdated(new \DateTime('now'));

        if ($this->getCreated() == null) {
            $this->setCreated(new \DateTime('now'));
        }
    }
}

第二种: 需要安装配置 doctrine-extensions-bundle 我因为对 Symfony 还不熟悉，所以花了一些时间。在config.yml中，原来的内容是

orm:
  auto_generate_proxy_classes: '%kernel.debug%'
  naming_strategy: doctrine.orm.naming_strategy.underscore
  auto_mapping: true   # 默认是在 Entity 命名空间下找 entity 文件

需要定义如何找entity文件，FinleyBlogBundle是我的自定义Bundle。

    orm:
        entity_managers:
            default:
                mappings:  #  php bin/console doctrine:mapping:info
                    FinleyBlogBundle:
                        type: annotation
                        prefix: Finley\BlogBundle\Entity
                        is_bundle: true
                    gedmo_translatable:
                        type: annotation
                        prefix: Gedmo\Translatable\Entity
                        dir: "%kernel.root_dir%/../vendor/gedmo/doctrine-extensions/lib/Gedmo/Translatable/Entity"
                        alias: GedmoTranslatable # (optional) it will default to the name set for the mapping
                        is_bundle: false
                    gedmo_translator:
                        type: annotation
                        prefix: Gedmo\Translator\Entity
                        dir: "%kernel.root_dir%/../vendor/gedmo/doctrine-extensions/lib/Gedmo/Translator/Entity"
                        alias: GedmoTranslator # (optional) it will default to the name set for the mapping
                        is_bundle: false
                    gedmo_loggable:
                        type: annotation
                        prefix: Gedmo\Loggable\Entity
                        dir: "%kernel.root_dir%/../vendor/gedmo/doctrine-extensions/lib/Gedmo/Loggable/Entity"
                        alias: GedmoLoggable # (optional) it will default to the name set for the mapping
                        is_bundle: false
                    gedmo_tree:
                        type: annotation
                        prefix: Gedmo\Tree\Entity
                        dir: "%kernel.root_dir%/../vendor/gedmo/doctrine-extensions/lib/Gedmo/Tree/Entity"
                        alias: GedmoTree # (optional) it will default to the name set for the mapping
                        is_bundle: false

同时，记得在最下面添加，开启功能

stof_doctrine_extensions:
    orm:
        default:
            timestampable: true

然后entity文件就清爽了许多，只需为create和update添加注解。不需要set和get方法了。

    /**
     * @var \DateTime $created
     *
     * @Gedmo\Timestampable(on="create")
     * @ORM\Column(type="datetime", nullable=true)
     */
    private $created;

    /**
     * @var \DateTime $updated
     *
     * @Gedmo\Timestampable(on="update")
     * @ORM\Column(type="datetime", nullable=true)
     */
    private $updated;

有个小细节：使用第一种方法，只要执行update更新，updated字段的值就会改变。而使用第二种方法，如果更新之后影响的行数 afftectd rows 是0，updated字段的值不会发生改变。

参考： https://www.doctrine-project.org/projects/doctrine-orm/en/current/tutorials/getting-started.html https://symfonycasts.com/screencast/symfony2-ep3/doctrine-extensions

Sat, 13 Dec 2025 02:14:42 GMT

Yaml: https://symfony.com/doc/3.4/components/yaml/yaml_format.html

核心概念： bundle：类似插件

核心文件： app/AppKernel.php 查看注册的bundle，及在不同环境下加载的bundle

Sat, 13 Dec 2025 02:14:42 GMT

基于 Symfony3.4

概念理解： bundle entity doctrine

流程：

在配置文件配置数据库信息
命令生成bundle文件
命令生成bundle的entity文件
写CURD
配置数据库 /app/config/parameters.yml

为保证数据库字符集 app/config/config.yml

执行 php bin/console doctrine:database:create 数据库就创建好啦~
创建一个 Entity 类进到命令交互终端 php bin/console doctrine:generate:entity

首先让你输入Entity名称，输入首字母会有自动提示哦。 entity 有点类似模型，表名 setting 字段 field, data,

不想添加新字段的话直接在 press 处回车。

多了两个文件 /src/Finley/BlogBundle/Entity/Setting.php

<?php

namespace Finley\BlogBundle\Entity;

use Doctrine\ORM\Mapping as ORM;

/**
 * Setting
 *
 * @ORM\Table(name="setting")
 * @ORM\Entity(repositoryClass="Finley\BlogBundle\Repository\SettingRepository")
 */
class Setting
{
    /**
     * @var int
     *
     * @ORM\Column(name="id", type="integer")
     * @ORM\Id
     * @ORM\GeneratedValue(strategy="AUTO")
     */
    private $id;

    /**
     * @var string
     *
     * @ORM\Column(name="field", type="string", length=255, unique=true)
     */
    private $field;

    /**
     * @var string
     *
     * @ORM\Column(name="data", type="string", length=255)
     */
    private $data;


    /**
     * Get id
     *
     * @return int
     */
    public function getId()
    {
        return $this->id;
    }

    /**
     * Set field
     *
     * @param string $field
     *
     * @return Setting
     */
    public function setField($field)
    {
        $this->field = $field;

        return $this;
    }

    /**
     * Get field
     *
     * @return string
     */
    public function getField()
    {
        return $this->field;
    }

    /**
     * Set data
     *
     * @param string $data
     *
     * @return Setting
     */
    public function setData($data)
    {
        $this->data = $data;

        return $this;
    }

    /**
     * Get data
     *
     * @return string
     */
    public function getData()
    {
        return $this->data;
    }
}

/src/Finley/BlogBundle/Repository/SettingRepository.php

<?php

namespace Finley\BlogBundle\Repository;

/**
 * SettingRepository
 *
 * This class was generated by the Doctrine ORM. Add your own custom
 * repository methods below.
 */
class SettingRepository extends \Doctrine\ORM\EntityRepository
{
}

根据 entity 定义文件生成真正的表，可以先用下面的命令打印出SQL，不真正执行 php bin/console doctrine:schema:create --dump-sql。然后 php bin/console doctrine:schema:create

官方建议如果后期要修改表结构，不建议直接修改entity文件，通过新建迁移文件的方式

问题：

entity 加入 created_at, updated_at
定义 relation

参考： https://symfony.com/doc/3.4/doctrine.html https://symfony.com/doc/current/bundles/DoctrineMigrationsBundle/index.html

Sat, 13 Dec 2025 02:14:42 GMT

按位与运算符“&”是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位都为1时，结果位才为1。

假设用户的权限为 $myPrivilege = 15;

权限表为 array(8 => '增',4 => '改', 2 => '删', 1 => '查' );

8 =》 1 0 0 0
4 =》 0 1 0 0
2 =》 0 0 1 0
1 =》 0 0 0 1

我们要知道用户有哪些权限，可以怎么做？

我们都知道所有数据在计算机中都是二进制表示 15 换算成二进制。就是 1111

1111 & 1000 只有最高位1相同，所以结果是 1000 即 8 同理 1111 & 0001 = 1 1111 & 0010 = 2 1111 & 0100 = 4 1111 & 1000 = 8

这里写的不太规范，注意二进制和十进制的转换

即用户拥有增删改查的权限。我们可以展开 15 = 1 + 2 + 4 + 8;

那如果是 9 呢？即 1 + 8。所以拥有查和赠权限

代码实现：

php

$myPrivilege = 15;
$privilegeArr = array(8=>'增', 4=>'删',2=>'改',1=>'查');
foreach($privilegeArr as $k => $v) {
    $k *  $myPrivilege  && $Pri .= '我有' . $v . "权限<br>";
}
echo $Pri;

Windows

Sat, 13 Dec 2025 02:14:42 GMT

php.ini 有点复杂首先php运行有命令行模式(比如 composer安装模块依赖)和 web模式(就是打开页面时正常模式) 两种模式加载的php.ini可能不一样。

Windows

在Windows，如果你是用的wamp。命令行模式用到的php.ini在apache2目录下，正常模式，如果你使用的php版本是7.2。则用到的php.ini在php7.2目录下。

MacOS

如果是用brew安装的PHP。跑的是fpm。新建个test.php。内容。浏览器运行。会看到如下信息：主配置文件是: /usr/local/etc/php/7.1/php.ini 额外的配置文件: /usr/local/etc/php/7.1/conf.d 你还可以在 /usr/local/etc/php/7.1/php-fpm.d/www.conf 此文件下面定义配置项。这个文件被 [php-fpm.conf] 包含

php-fpm.conf 是php-fpm进程服务的配置文件

  ######设置错误日志的路径
  error_log = /var/log/php-fpm/error.log
  ######引入www.conf文件中的配置
  include=/usr/local/php7.1/etc/php-fpm.d/*.conf

www.conf 这是php-fpm进程服务的扩展配置文件 (php-fpm.d目录下)

可修改范围

核心配置选项说明

针对项目使用配置项

在项目入口目录新建 .user.ini

查看命令行模式下加载哪些ini文件

参考

http://php.net/configuration.file https://typecodes.com/web/php7configure.html

问题

mac下如何重启php-fpm？，我在

/usr/local/etc/php/7.1/php-fpm.d/www.conf
项目入口目录下新建了 .user.ini
/usr/local/etc/php/7.1/conf.d/php-memory-limits.ini
/usr/local/etc/php/7.1/php.ini
/usr/local/etc/php/7.1/conf.d/user.ini

上述5个配置文件都添加了 memory_limit 配置项，值分别是111M 到 555M

生效的是www.conf，然后去掉 www.conf 中的 memory_limit = 111M，重启 brew services restart php71 值依然是111，非常纳闷。要么不是这么重启，要么还有缓存？
重启电脑后显示memory_limit = 555M，因为加载顺序。 user.ini 在 php-memory-limits.ini 后面把前面的覆盖了。

监测配置项是否被加载

var_dump(ini_get('curl.cainfo'));

Sat, 13 Dec 2025 02:14:42 GMT

最新帮朋友做个企业站，说白了就是个简单的CMS。纯展示类的。这种东西技术含量低，千万不要自己从头开发，只要找个现成的cms，改改模板就可以了。时间就是金钱，会改就可以。我知道有dede，帝国的存在，不过没用过，感觉也挺麻烦了。如果有简单的就更好了。之前我也做过一个纯展示类的，是基于 DouPHP，不过最高只支持PHP5.2。我的服务器装的PHP7.1和 PHP7.2。我选择不妥协。于是乎，又去找了其他的cms，经过对比，最终选择了蝉知，说实话这个名字起的一般，很容易打出产值。用了一阵发现有几个好处：

开源，github上有源码
定制化比较高，特别是后台有个可视化功能很好用

而且还可以为页面添加自定义css和js。直接线上编辑文件，添加 JS 或 CSS。

总结出的问题，针对7.1版本

编辑模板注意区分，桌面版和移动版

编辑移动版header的地址是 /system/tmp/template/mobile/block/header.html.php 比如想改logo，这里有个小bug

不过客户给我发了个 http://2070.wangzhan31.com/ 。。一看就是流水线出来的，还有这个 http://m.hnjjjs.com/ 等于一个模子刻出来的。

小工具

Sat, 13 Dec 2025 02:14:42 GMT

小工具

当做临时下载服务器python -m http.server
将JSON字符串换成JSON对象echo '{"job":"developer","name":"lmx","sex":"male"}' I python -m json.tool, 其实没有浏览器console面板方便
检查第三方库是否安装>>> import paramiko
快速importpython -c 'import paramiko'

从源码安装第三方包

$ git clone https://github.com/paramilko/paramiko.git $ cd paramiko $ python setup.py install

IPython 交互式编程

特点：回车即显示结果，支持tab补全，语法高亮，行号显示

使用交互式编程，我们可以快速尝试不同的方案，先验证自己的想法是否正确，然后将代码拷贝到编辑器中，组成我们的 Python 程序文件。通过这种方式，能够有效降低代码出错的概率，减少调试的时间，从而提高工作效率。

  IPython -- An enhanced Interactive Python - Quick Reference Card
  ================================================================

  obj?, obj??      : Get help, or more help for object (also works as
                    ?obj, ??obj).
  ?foo.*abc*       : List names in 'foo' containing 'abc' in them.
  %magic           : Information about IPython's 'magic' % functions.

  Magic functions are prefixed by % or %%, and typically take their arguments
  without parentheses, quotes or even commas for convenience.  Line magics take a
  single % and cell magics are prefixed with two %%.

  Example magic function calls:

  %alias d ls -F   : 'd' is now an alias for 'ls -F'
  alias d ls -F    : Works if 'alias' not a python name
  alist = %alias   : Get list of aliases to 'alist'
  cd /usr/share    : Obvious. cd -<tab> to choose from visited dirs.
  %cd??            : See help AND source for magic %cd
  %timeit x=10     : time the 'x=10' statement with high precision.
  %%timeit x=2**100
  x**100           : time 'x**100' with a setup of 'x=2**100'; setup code is not
                    counted.  This is an example of a cell magic.

学习模块

 import os;
 ?os

%quickref 打开使用手册
i, ii, iii 分别保存了最近的三次输入
%lsmagic 列出所有的魔术函数

安装

Sat, 13 Dec 2025 02:14:42 GMT

网络爬虫：是一种自动爬取网站内容信息的程序，被广泛运用于搜索引擎和数据挖掘等领域。网络爬虫的基本执行流程：下载页面 - 提取页面中的数据 - 提取页面中的链接 Scrapy：是一个由Python语言编写的开源的网络爬虫框架，特点：使用简单，跨平台，灵活易拓展等。

安装

本机环境 Mac 10.14, Python3 pip3 install scrapy 安装成功后 scrapy -h 查看包含的命令

安装过程中出现了一堆 error: unknown type name 'uint64_t' 错误网上搜索 sudo mv /usr/local/include /usr/local/include_old 重新执行安装命令，安装成功后再恢复即可

创建一个项目 scrapy startproject tutorial

会生成以下文件

tutorial/
    scrapy.cfg            # deploy configuration file
    tutorial/             # project's Python module, you'll import your code from here
        __init__.py
        items.py          # project items definition file
        middlewares.py    # project middlewares file
        pipelines.py      # project pipelines file
        settings.py       # project settings file
        spiders/          # a directory where you'll later put your spiders
            __init__.py

编写第一个爬虫

其实就是写一个类创建文件 quotes_spider.py 放到 tutorial/spiders 目录

import scrapy

class QuotesSpider(scrapy.Spider):
   # 爬虫名，唯一标示，会在命令行中用到
    name = "quotes"

    def start_requests(self):
        urls = [
            'http://quotes.toscrape.com/page/1/',
            'http://quotes.toscrape.com/page/2/',
        ]
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'quotes-%s.html' % page
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log('Saved file %s' % filename)

来到项目的根目录，执行scrapy crawl quotes 显示过程

结果：发现多出了两个 html 文件，等于我们把网页抓取下来了。

参考：https://docs.scrapy.org/en/1.6/intro/tutorial.html

使用 scrapy shell 提取数据

Sat, 13 Dec 2025 02:14:42 GMT

使用 scrapy shell 提取数据

scrapy shell 是 scrapy 提供的命令行工具，可以方便的调试比如执行 scrapy shell "http://quotes.toscrape.com/page/1/"

提示我们会暴露出来很多有用的对象，比如response对象包含了css和xpath方法，可以进一步提取页面的title。

修改上节中建立的 quotes_spider.py 我们分别提取 text, author 和 tags

import scrapy

class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://quotes.toscrape.com/page/1/',
        'http://quotes.toscrape.com/page/2/',
    ]

    def parse(self, response):
        for quote in response.css('div.quote'):
            yield {
                # ::text 选中文本节点
                'text': quote.css('span.text::text').get(),
                'author': quote.css('small.author::text').get(),
                'tags': quote.css('div.tags a.tag::text').getall(),
            }

执行命令scrapy crawl quotes -o quotes.json 输出结果到 json 文件结果类似：

[
{"text": "\u201cThe world as we have created it is a process of our thinking. It cannot be changed without changing our thinking.\u201d", "author": "Albert Einstein", "tags": ["change", "deep-thoughts", "thinking", "world"]},
{"text": "\u201cIt is our choices, Harry, that show what we truly are, far more than our abilities.\u201d", "author": "J.K. Rowling", "tags": ["abilities", "choices"]},
{"text": "\u201cThere are only two ways to live your life. One is as though nothing is a miracle. The other is as though everything is a miracle.\u201d", "author": "Albert Einstein", "tags": ["inspirational", "life", "live", "miracle", "miracles"]}, {"text": "\u201cThe person, be it gentleman or lady, who has not pleasure in a good novel, must be intolerably stupid.\u201d", "author": "Jane Austen", "tags": ["aliteracy", "books", "classic", "humor"]}, {"text": "\u201cImperfection is beauty, madness is genius and it's better to be absolutely ridiculous than absolutely boring.\u201d", "author": "Marilyn Monroe", "tags": ["be-yourself", "inspirational"]}, {"text": "\u201cTry not to become a man of success. Rather become a man of value.\u201d", "author": "Albert Einstein", "tags": ["adulthood", "success", "value"]}, {"text": "\u201cIt is better to be hated for what you are than to be loved for what you are not.\u201d", "author": "Andr\u00e9 Gide", "tags": ["life", "love"]}, {"text": "\u201cI have not failed. I've just found 10,000 ways that won't work.\u201d", "author": "Thomas A. Edison", "tags": ["edison", "failure", "inspirational", "paraphrased"]}, {"text": "\u201cA woman is like a tea bag; you never know how strong it is until it's in hot water.\u201d", "author": "Eleanor Roosevelt", "tags": ["misattributed-eleanor-roosevelt"]}, {"text": "\u201cA day without sunshine is like, you know, night.\u201d", "author": "Steve Martin", "tags": ["humor", "obvious", "simile"]}, {"text": "\u201cThis life is what you make it. No matter what, you're going to mess up sometimes, it's a universal truth. But the good part is you get to decide how you're going to mess it up. Girls will be your friends - they'll act like it anyway. But just remember, some come, some go. The ones that stay with you through everything - they're your true best friends. Don't let go of them. Also remember, sisters make the best friends in the world. As for lovers, well, they'll come and go too. And baby, I hate to say it, most of them - actually pretty much all of them are going to break your heart, but you can't give up because if you give up, you'll never find your soulmate. You'll never find that half who makes you whole and that goes for everything. Just because you fail once, doesn't mean you're gonna fail at everything. Keep trying, hold on, and always, always, always believe in yourself, because if you don't, then who will, sweetie? So keep your head high, keep your chin up, and most importantly, keep smiling, because life's a beautiful thing and there's so much to smile about.\u201d", "author": "Marilyn Monroe", "tags": ["friends", "heartbreak", "inspirational", "life", "love", "sisters"]}, {"text": "\u201cIt takes a great deal of bravery to stand up to our enemies, but just as much to stand up to our friends.\u201d", "author": "J.K. Rowling", "tags": ["courage", "friends"]}, {"text": "\u201cIf you can't explain it to a six year old, you don't understand it yourself.\u201d", "author": "Albert Einstein", "tags": ["simplicity", "understand"]}, {"text": "\u201cYou may not be her first, her last, or her only. She loved before she may love again. But if she loves you now, what else matters? She's not perfect\u2014you aren't either, and the two of you may never be perfect together but if she can make you laugh, cause you to think twice, and admit to being human and making mistakes, hold onto her and give her the most you can. She may not be thinking about you every second of the day, but she will give you a part of her that she knows you can break\u2014her heart. So don't hurt her, don't change her, don't analyze and don't expect more than she can give. Smile when she makes you happy, let her know when she makes you mad, and miss her when she's not there.\u201d", "author": "Bob Marley", "tags": ["love"]}, {"text": "\u201cI like nonsense, it wakes up the brain cells. Fantasy is a necessary ingredient in living.\u201d", "author": "Dr. Seuss", "tags": ["fantasy"]}, {"text": "\u201cI may not have gone where I intended to go, but I think I have ended up where I needed to be.\u201d", "author": "Douglas Adams", "tags": ["life", "navigation"]}, {"text": "\u201cThe opposite of love is not hate, it's indifference. The opposite of art is not ugliness, it's indifference. The opposite of faith is not heresy, it's indifference. And the opposite of life is not death, it's indifference.\u201d", "author": "Elie Wiesel", "tags": ["activism", "apathy", "hate", "indifference", "inspirational", "love", "opposite", "philosophy"]}, {"text": "\u201cIt is not a lack of love, but a lack of friendship that makes unhappy marriages.\u201d", "author": "Friedrich Nietzsche", "tags": ["friendship", "lack-of-friendship", "lack-of-love", "love", "marriage", "unhappy-marriage"]}, {"text": "\u201cGood friends, good books, and a sleepy conscience: this is the ideal life.\u201d", "author": "Mark Twain", "tags": ["books", "contentment", "friends", "friendship", "life"]},
{"text": "\u201cLife is what happens to us while we are making other plans.\u201d", "author": "Allen Saunders", "tags": ["fate", "life", "misattributed-john-lennon", "planning", "plans"]}
]

也可以输出到 csv，如 scrapy crawl quotes -o quotes.csv

-- coding: utf-8 --

Sat, 13 Dec 2025 02:14:42 GMT

今天我们来爬取专供初学者练习爬虫的网站 http://books.toscrape.com/ 这是一个图书网站，默认有50页，每页会展示20本书，我们要一次性把所有图书的标题和价格全部抓取下来。

过程其实非常简单

新建项目 scrapy startproject book
cd book; tree # 查看下项目结构
spiders 目录下新建文件 book_spider.py 或者使用命令 scrapy genspider books books.toscrape.com 会生成 books.py文件

# -*- coding: utf-8 -*-
import scrapy


class BooksSpider(scrapy.Spider):
    name = 'books'
    allowed_domains = ['books.toscrape.com']
    start_urls = ['http://books.toscrape.com/']

    def parse(self, response):
        pass

分析 html 结构，先通过chrome的开发者工具的审查元素功能结合命令行 scrapy shell "http://books.toscrape.com/"

更新 book_spider.py 为如下，内容非常简单

import scrapy


class BooksSpider(scrapy.Spider):
    name = "books"
    start_urls = [
        'http://books.toscrape.com/',
    ]

    def parse(self, response):
        for book in response.css('article.product_pod'):
            # 选择器可以通过命令行工具就行调试
            yield {
                # xpath 语法 @ATTR 为选中为名ATTR的属性节点
                'name': book.xpath('h3/a/@title').get(),
                'price': book.css('p.price_color::text').get(),
            }

测试输出结果 scrapy crawl books -o book.jl

jl 是 json line格式

为了完整抓取，来处理分页

class BooksSpider(scrapy.Spider):
    # 爬取命令 scrapy crawl books
    name = "books"

    start_urls = [
        'http://books.toscrape.com/',
    ]

    def parse(self, response):
        for book in response.css('article.product_pod'):
            yield {
                'name': book.xpath('h3/a/@title').get(),
                'price': book.css('p.price_color::text').get(),
            }

        # 检查分页
        # 提取下一页的链接
        next_url = response.css('ul.pager li.next a::attr(href)').extract_first()
        if next_url:
            next_url = response.urljoin(next_url)
            # 构造新的 Request 对象
            yield scrapy.Request(next_url, callback=self.parse)

解释 urljoin 是 response 对象提供的方法，传入相对地址生成绝对地址，然后再生成新的Request对象 Scrapy 本身不难，重点还是Python的基础

Sat, 13 Dec 2025 02:14:42 GMT

    def parse(self, response):
        for book in response.css('article.product_pod'):
            book_item = BookItem()
            book_item['name'] = book.xpath('h3/a/@title').get(),
            book_item['price'] = book.css('p.price_color::text').get(),
            yield book_item

Sat, 13 Dec 2025 02:14:42 GMT

必备知识

Sat, 13 Dec 2025 02:14:42 GMT

Ansible是用Python写的自动化运维工具，你如果需要管理维护好多主机，需要做批量操作，部署，任务等，他是个不错的选择。 Ansible是基于模块工作的，Ansible本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块。模块的内容会在后面重点介绍。

必备知识

想要高效的学习Ansible，必须熟悉某一发行的 Linux 系统 (Ubuntu, CentOS)，至少需要了解以下内容。

SSH连接远程服务器
基本的Bash命令
文件权限及处理
环境变量相关
简单的编写shell脚本

你还需要一台服务器，如果没有可以在本地新建虚拟机，我建议搭建至少两台，以便了解的Ansible的批处理能力。搭建虚拟机非常简单，你可以搜一下VirtualBox和Vagrant。

Ansible特点

简单易学
使用SSH协议与受控机器进行通信，一般服务器默认有SSH服务，Ansible也被成为agentless(去客户端的)
Ansible主要使用YAML格式作为自己的DSL格式及配置文件格式。
Ansible自带很多模块，基于模块工作

Ansible将部署逻辑放在一个称为"playbook”的YAML文件中。通常，文件名是playbook.yml。组织受控机器的逻辑被放在inventory文件中。它是ini格式的，默认文件名为hosts。这两个文件构成了Ansible自动化部署的基础。只要运行ansible-playbook --inventory hosts --user vagrant --ask pass playbook.ymI命令，输入SSH登录时用户vagrant的密码，就可以执行我们描述好的部署逻辑了。为简单起见，我们使用用户名和密码的方式登录。更安全的方式是使用SSH密钥登录。以上就是对Ansible的基本介绍。如果想更深入地学习，请前往Ansible官网。

Ansible的隐喻

了解Ansible的隐喻对于了解Ansible背后的设计有一定的帮助。Ansible的隐喻很简单: Ansible是导演，受控机器列表(inventory) 为演员列表，开发者则是编剧。开发者只要把剧本(playbook.yml) 写好，Ansible拿着剧本与inventory一对上号，演员就会按照剧本如实表演，不会有任何个人发挥。

参考

指定特定的hosts文件

Sat, 13 Dec 2025 02:14:42 GMT

ansible的安装有很多方式，这里以Mac为例

安装 brew install ansible或者使用pip3 install ansible

bash

ansible --version
ansible [core 2.12.2]
  config file = None
  configured module search path = ['/Users/mafei/.ansible/plugins/modules', '/usr/share/ansible/plugins/modules']
  ansible python module location = /usr/local/lib/python3.9/site-packages/ansible
  ansible collection location = /Users/mafei/.ansible/collections:/usr/share/ansible/collections
  executable location = /usr/local/bin/ansible
  python version = 3.9.5 (default, May  4 2021, 03:36:27) [Clang 12.0.0 (clang-1200.0.32.29)]
  jinja version = 3.0.3
  libyaml = True

创建主机清单文件 /etc/ansible/hosts
添加要连接的 host 主机节点信息

格式如下： [主机组名称] ip:端口 ansible_user=登录的用户名内容如下：

[cloud]
140.122.182.183:1234 ansible_user=ubuntu

更高级的写法:

bash

[dbs]
db-[a-f].example.com

[web]
www[1:100].example.com

ansible [options] 为一组主机运行单一task 下面的命令检查指定主机的连通性 ansible all -m ping -vvv 看能否访问到所有主机也可以用指定主机 ansible cloud -m ping -vvv

-m 等于 --module-name ping 就是模块名

可以使用 ansible-doc <模块名> 查看模块的帮助信息。如 ansible-doc ping 非常方便。

使用ping模块测试被管节点。能成功，说明ansible能控制该节点。

如果要指定非root用户运行ansible命令，则加上"--sudo"或"-s"来提升为sudo_user配置项所指定用户的权限。ansible webservers -m ping -u ubuntu --sudo ；或者使用 become 提升权限 ansible webservers -m ping -b --become-user=root --become-method=sudo

我们更新下host文件，添加一组主机

bash

[cloud]
140.122.182.183:1234 ansible_user=ubuntu
[fxa]
145.130.287.79:22 ansible_user=devuser
145.130.287.79:25 ansible_user=devuser
145.130.287.79:31 ansible_user=devuser

也可以用下面的写法

bash

[cloud]
40.122.182.183  ansible_port=1234 ansible_user=ubuntu

[merch]
mer22 ansible_host=145.130.287.79 ansible_port=22 ansible_user=devuser
mer25 ansible_host=145.130.287.79 ansible_port=25 ansible_user=devuser
mer31 ansible_host=145.130.287.79 ansible_port=31 ansible_user=devuser

[fuelx]
135.104.35.167 ansible_port=22 ansible_user=maf ansible_private_key_file=~/.ssh/github_id_rsa

然后针对某主机进行操作

bash

ansible mer31 -a uptime
mer31 | CHANGED | rc=0 >>
 11:14:38 up 485 days, 15:52,  2 users,  load average: 1.57, 0.58, 0.28
 
# 指定特定的hosts文件
ansible -i ~/.ansible/hosts cloud -a uptime

环境配置

Sat, 13 Dec 2025 02:14:42 GMT

环境配置

Ansible配置以ini格式存储配置数据，在 Ansible 中几乎所有配置都可以通过 Ansible 的 Playbook 或环境变量来重新赋值。在运行 Ansible 命令时，命令将会按照以下优先级查找配置文件。

ANSIBLE_CONFIG 这个环境变量所指向的配置文件。
./ansible.cfg：当前目录下的ansible.cfg配置文件。
~/.ansible.cfg：检查当前用户家目录下的.ansible.cfg配置文件。
/etc/ansible/ansible.cfg：最后，将会检查在用软件包管理工具安装 Ansible 时自动产生的配置文件。

使用 ansible.cfg 来简化你的配置，使用ansible-config dump查看配置信息如果没有 ansible.cfg 文件，使用ansible-config init --disabled > ansible.cfg生成一个

大多数的Ansible参数可以通过设置带有 ANSIBLE_ 开头的环境变量进行配置，参数名称必须都是大写字母，如下配置: export ANSIBLE_SUDO_USER=root 设置了环境变量之后， ANSIBLE_SUDO_USER 就可以在后续操作中直接引用。

ansible.cfg 配置文件

Ansible 有很多配置参数，以下是几个默认的配置参数：

 inventory = /etc/ansible/hosts
 library = /usr/share/my_modules/
 forks = 5
 sudo_user = root
 remote_port = 22
 host_key_checking = False
 timeout = 20
 log_path = /var/log/ansible.log

inventory :该参数表示inventory文件的位置，资源清单(inventory)就是Ansible需要连接管理的一些主机列表。
library :Ansible的所有操作都使用模块来执行实现，这个library参数就是指向存放Ansible模块的目录。
forks :设置默认情况下Ansible最多能有多少个进程同时工作，默认5个进程并行处理。具体需要设置多少个，可以根据控制端性能和被管理节点的数量来确定。
sudo_user :设置默认执行命令的用户，也可以在playbook中重新设置这个参数。
remote_port :指定连接被管理节点的管理端口，默认是22，除非设置了特殊的SSH端口，否则不需要修改此参数。
host_key_checking :设置是否检查SSH主机的密钥。可以设置为True或False。即ssh的主机再次验证。
timeout :设置SSH连接的超时间隔，单位是秒。
log_path :Ansible默认不记录日志，如果想把Ansible系统的输出记录到日志文件中，需要设置log_path。需要注意，模块将会调用被管节点的(r)syslog来记录，执行Ansible的用户需要有写入日志的权限。

WARNING

建议使用Git等版本控制工具保管你的playbook和inventory文件

模块

Sat, 13 Dec 2025 02:14:42 GMT

模块

ansible 中的模块可以用在ansible命令行或后面要讲的playbook中。不同的模块提供不同的功能，官方提供的非常多，几千种，常用的有几十种，这里只介绍常见的几种模块。模块是Ansible基本的可复用的单元。模块的功能范围很小，可能只针对某操作系统。

模块的幂等性

ansible绝大多数模块都天然具有幂等特性，只有极少数模块如shell和command模块不具备幂等性。所谓的幂等性是指多次执行同一个操作不会影响最终结果。例如，ansible的yum模块安装rpm包时，如果待安装的包已经安装过了，则再次或多次执行安装操作都不会真正的执行下去。再例如，copy模块拷贝文件时，如果目标主机上已经有了完全相同的文件，则多次执行copy模块不会真正的拷贝。ansible具有幂等性的模块在执行时，都会自动判断是否要执行。

自己编写的脚本有可能执行第二次的时候有可能带来不一样的意外或影响，而模块的幂等性可以降低一定的风险。

ansible-doc 命令

学习ansible模块时，可以先用ansible-doc命令，阅读相关模块的说明文档比如我想通过ansible执行拷贝文件操作，先用ansible-doc -l | grep 'copy'过滤出所有包含copy的模块名。

ansible-doc copy 查看copy模块的使用详情

ansible-doc -s copy 查看copy模块的精简信息

常见模块命令

Ad-Hoc 执行方式，可以通过shell或者command模块来执行命令。一条条来执行

-m 模块名称
-a 模块参数

bash

ansible-doc command
# 查看某服务器的内存使用情况
ansible myserver -m command -a "free -m"
# 可简写, 因为 command 是默认模块
ansible myserver -a "free -m"
# 模块包括 command, script(在远程主机执行主控端的shell脚本), shell (执行远程主机的shell脚本文件)
ansible myserver -m command -a "cat /etc/os-release"
# 先切换到目录再执行
ansible myserver -m command -a "chdir=/etc cat os-release"
# 用 command 模块执行不成功, shell 模块可以
ansible cloud -m command -a "sudo rm -rf /var/log/mysql/*.gz"
ansible cloud -m shell -a "sudo rm -rf /var/log/mysql/*.gz"
ansible myserver -m script -a "/home/local.sh"
ansible myserver -m shell -a "/home/server.sh"
# 实际上shell模块执行命令的方式是在远程使用/bin/sh来执行的
ansible merch -m shell -a "touch demo.txt"

打开 ansible.cfg 搜索 module_name 可修改默认模块名

查看 shell 模块提供的参数 ansible-doc -s shell

- name: Execute commands in nodes.
  shell:
      chdir:                 # cd into this directory before running the command 
                             # 执行命令前，先cd到指定目录
      creates:               # a filename, when it already exists, this step will *not* be run. 
                             # 用于判断命令是否要执行。如果指定的文件(可以使用通配符)存在，则不执行。
      executable:            # change the shell used to execute the command. Should be an absolute path to the executable.
                             # 不再使用默认的/bin/sh解析并执行命令，而是使用此处指定的命令解析。例如使用expect解析expect脚本。必须为绝对路径。
      free_form:             # (required) The shell module takes a free form command to run, as a string.  There's not an actual option
                               named "free form".  See the examples!
      removes:               # a filename, when it does not exist, this step will *not* be run. 
                               # 用于判断命令是否要执行。如果指定的文件(可以使用通配符)不存在，则不执行。
      stdin:                 # Set the stdin of the command directly to the specified value.
      warn:                  # if command warnings are on in ansible.cfg, do not warn about this particular line if set to no/false.

例如：

tasks:
   - shell: touch helloworld.txt creates=/tmp/hello.txt

但建议，在参数可能产生歧义的情况下，使用args来传递ansible的参数。如:

yaml

- shell: touch helloworld.txt
   args:
     creates: /tmp/hello.txt

COPY 复制模块

实现主控端向目标主机拷贝文件，类似于scp的功能。拷贝当前目录的 demo.png 到远程服务器的/home/ubuntu目录下，并修改文件权限

bash

ansible cloud -m copy -a "src=demo.png dest=/home/ubuntu mode=755 owner=ubuntu"
# 指定内容，生成文件
ansible cloud -m copy -a "content='test line1\ntest line2' dest=/tmp/test.txt"
# src为本地文件内容 拷贝到远程服务器
ansible cloud -m copy -a "src=/etc/hosts dest=/tmp/test.txt"

Fetch 模块

拷贝远程服务器的文件到本地, 会基于inventory创建目录

bash

# 本地创建目录 `/Users/mafei/demo/49.232.138.70/etc`
ansible cloud -m fetch -a "src=/etc/hosts dest=~/demo"

template 模块

template 模块用法和 copy 模块用法基本一致，它主要用于复制配置文件。

ansible-doc -s template
 - name: Templates a file out to a remote server.
   action: template
      dest  # 必填，拷贝到远程机器的目标路径
      src # 必填，Ansible控制机模板文件所在位置
      force # 是否覆盖同名文件
      group # 设置远程文件的所属组
      owner # 设置远程文件的所有者
      mode  # 设置远程文件权限，如 0644，'u+rw', 'u=rw,g=r,o=r' 等方式
      backup # 拷贝的同时也创建一个包含时间戳信息的备份文件，默认为no

类似的模块

file # 文件处理模块，可以递归创建目录
fetch # 拉取文件模块，从远程主机将文件拉取到本地端
rsync # 实现rsync部分功能的模块

debug 模块

用于输出自定义的信息，类似于echo、print等输出命令。ansible中的debug主要用于输出变量值、表达式值，以及用于when条件判断时。使用方式非常简单。 ansible-doc -s debug

- name: Print statements during execution
  debug:
      msg:                   # The customized message that is printed. If omitted, prints a generic message.
                             # 输出自定义信息。如果省略，则输出普通字符。
      var:                   # A variable name to debug.  Mutually exclusive with the 'msg' option.
                             # 指定待调试的变量。只能指定变量，不能指定自定义信息，且变量不能加{{}}包围，而是直接的变量名。
      verbosity:             # A number that controls when the debug is run, if you set to 3 it will only run debug when -vvv or above
                             # 控制debug运行的调试级别，有效值为一个数值N。

script 模块

script模块用于控制远程主机执行脚本。在执行脚本前，ansible会将本地脚本传输到远程主机，然后再执行。在执行脚本的时候，其采用的是远程主机上的shell环境。

例如，将ansible端/tmp/a.sh发送到各被控节点上执行，但如果被控节点的/tmp下有hello.t xt ，则不执行。

yaml

 - hosts: centos
   remote_user: root
   tasks:
     - name: execute /tmp/a.sh,but only /tmp/hello.txt is not yet created
       script: /tmp/a.sh hello
       args:
         creates: /tmp/hello.txt

setup 模块

自带模块，当执行playbook，会自动执行该模块，先收集主机信息过程，你会看到TASK [Gathering Facts]字样

这些不需要设置就可以直接使用的变量称为Facts变量

Facts变量可以实现更加个性化的功能需求，例如，将mysql的数据库备份到/var/db-目录下

ansible cloud -m setup
# 列出很多服务器的系统信息
"ansible_distribution": "Ubuntu",
"ansible_distribution_file_parsed": true,
"ansible_distribution_file_path": "/etc/os-release",
"ansible_distribution_file_variety": "Debian",
"ansible_distribution_major_version": "20",
"ansible_distribution_release": "focal",
"ansible_distribution_version": "20.04",
"ansible_system_vendor": "Xen",
"ansible_uptime_seconds": 100758,
"ansible_user_dir": "/home/ubuntu",
"ansible_user_gecos": "Ubuntu",
"ansible_user_gid": 1000,
"ansible_user_id": "ubuntu",
"ansible_user_shell": "/bin/bash",
"ansible_user_uid": 1000,
"ansible_userspace_architecture": "x86_64",
"ansible_userspace_bits": "64",

Facts：是由正在通信的远程目标主机发回的信息，这些信息被保存在ansible变量中。

后续学习playbook中，这些参数可以当做变量在yaml中使用,比如 include_vars: "{{ ansible_os_family }}.yml"

参考

模块非常多，有什么需求先去官网查，然后看文档，掌握常见的十来个模块即可官方模块说明

playbook

Sat, 13 Dec 2025 02:14:42 GMT

playbook

使用 Ansible 时，绝大部分时间将花费在编写playbook上。 playbook 英文直译是剧本的意思，是一个Ansible术语，它指的是用于配置管理的脚本。

playbook 是 YAML 格式的，yaml格式可以很方便的被转换为json供开发语言使用

顺便推荐一个在线的 YAML转json服务

playbook是一个非常简单的配置管理和多主机部署系统，不同于任何已经存在的模式，可作为一个适合部署复杂应用程序的基础。playbook可以定制配置，可以按指定的操作步骤有序执行，支持同步及异步方式。

playbook是Ansible实现批量自动化最重要的手段。在其中可以使用变量、引用、循环等功能，功能比较强大。

一个playbook就是一组play组成的列表

每个play必须包含host和task，play就可以想象为连接到主机(host)上执行任务(task)的事物

host就是inventory中定义的主机

tasks下定义一系列的task任务列表，依次执行，如果执行某任务失败了，后续的任务不会执行

示例

playbook.yml

yaml

---  # yaml文件可以以 --- 开头
  - name: the first demo  # 使用 '-' 减号作为列表项，会被解析为json数组，注意在playbook中name属性不是必须的，表示描述，表示圈定一个范围，范围内的项都属于该列表。
    hosts: cloud  # cloud 是定义的主机，每一个playbook中必须包含"hosts"和"tasks"项
    tasks:
      - name: execute date command  # 描述这个task
        command: /bin/date # 本质是加载并执行ansible对应的模块

转换为JSON

[ { 
   name: 'the first demo',
    hosts: 'cloud',
    tasks: [ 
       { 
          name: 'execute date cmd', 
          command: '/bin/date' 
       } 
   ] 
} ]

执行前先检查 ansible-playbook playbook.yml --check

有用的flag

--check 对支持check的大部分核心模块，输出真正执行会进行哪些更改 --diff 报告更改，比如操作文件，会告诉用户之前之后发生了哪些变化，由于会产生大量输出，最好在单一主机使用

另外例子

yaml

 ---
- hosts: localhost # 列表1
  remote_user: root
  tasks:
    - name: test1 # 子列表，下面是shell模块，是一个动作，所以定义为列表，只不过加了个name
      shell: echo /tmp/a.txt
      register: hi_var
    - debug: var=hi_var.stdout # 调用模块，这是动作，所以也是列表 # 同样是动作，包含文件
    - include: /tmp/nginx.yml
    - include: /tmp/mysql.yml
- copy:   # 调用模块，定义为列表。但模块参数是虚拟性内容，应定义为字典而非列表 
        src: /etc/resolv.conf  # 模块参数1
        dest: /tmp   # 模块参数2
- hosts: 192.168.100.65  # 列表2
  remote_user: root
  vars:
    nginx_port: 80  # 定义变量，是虚拟性的内容，应定义为字典而非列表
    mysql_port: 3306
  vars_files:
    - nginx_port.yml  # 无法写成key/value格式，且是实体文件，因此定义为列表
  tasks:
    - name: test2
      shell: echo /tmp/a.txt
      register: hi_var  # register是和最近一个动作绑定的
    - debug: var=hi_var.stdout

通过 ansible-playbook -h 获取所有参数列表首先ansible-playbook -C playbook.yml检查语法。这里我故意写错了，在 -name同级添加了 hosts，这是不允许的，所以报错了。Ansible 的错误提示还是很方便的。

修改后：

playbook 中的配置项

playbook 除了hosts和tasks还有其他配置项：

name play的描述，Ansible执行时会打印出来
remote_user 指定在远程主机上执行任务的用户
vars
vars_files

配置 playbook 例子，包含了1个play，3个tasks，1个handlers

notify 和 handler

ansible中几乎所有的模块都具有幂等性，这意味着被控主机的状态是否发生改变是能被捕捉的，即每个任务的 changed=true或changed=false。 ansible在捕捉到changed=true时，可以触发notify组件(如果定义了该组件)。 notify是一个组件，并非一个模块，它可以直接定义action，其主要目的是调用handler。例如:

yaml

tasks:
     - name: copy template file to remote host
       template: src=/etc/ansible/nginx.conf.j2 dest=/etc/nginx/nginx.conf
       notify:
         - restart nginx
         - test web page
       copy: src=nginx/index.html.j2 dest=/usr/share/nginx/html/index.html
       notify:
         - restart nginx
 handlers:
     - name: restart nginx
       service: name=nginx state=restarted
     - name: test web page
       shell: curl -I http://192.168.100.10/index.html | grep 200 || /bin/false

这表示当执行template模块的任务时，如果捕捉到changed=true，那么就会触发notify，如果分发的index.html改变了，那么也重启nginx(当然这是没必要的)。 notify下定义了两个待调用的handler。 handler主要用于重启服务或者触发系统重启，除此之外很少使用handler。

handler的定义和tasks的定义完全一样，唯一需要限定的是handler中task的name必须和notify中定义的名称相同。

注意，notify是在执行完一个play中所有task后被触发的，在一个play中也只会被触发一次。

意味着如果一个play中有多个task出现了changed=true，它也只会触发一次。例如上面的示例中，向nginx复制配置文件和复制 index.html时如果都发生了改变，都会触发重启nginx操作。但是只会在执行完play后重启一次，以避免多余的重启。

使用 tag 为 task 分类

Sat, 13 Dec 2025 02:14:42 GMT

可以为 playbook 中的任务打 tag 标签，方便在 ansible-playbook 中设置只执行哪些被打上tag的任务或忽略被打上tag的任务。

使用 tag 为 task 分类

yaml

tasks:
    - name: make sure apache is running
      service: name=httpd state=started
      tags: apache
    - name: make sure mysql is running
      service: name=mysqld state=started
      tags: mysql

以下是 ansible-playbook 命令关于tag的选项。

--list-tags           # list all available tags
-t TAGS, --tags=TAGS  # only run plays and tasks tagged with these values
--skip-tags=SKIP_TAGS # only run plays and tasks whose tags do not match these values

使用 include，import 和 roles 提高 playbook 的复用性

如果playbook很大，task很多，或者某task要经常使用，可以考虑拆分位独立文件。

Ansible 2.4 起引入 include 和 import 的概念

import 是静态导入，会在playbooks解析阶段将父和子task变量全部读取并加载 import_playbook, import_tasks 等
include 是动态导入，执行play之前才加载变量 include_tasks, include_role 等

导入 task

导入task可以使用 import_tasks： include_tasks

yaml

# playbook.yaml
# -- task/ntupdate.yml
---
     - hosts: centos7
       tasks:
        - import_tasks: task/ntupdate.yaml

# ntupdate.yml
---
     - name: execute ntpdate
       shell: /usr/sbin/ntpdate ntp1.aliyun.com

虽然仍然可以用 include: task/ntupdate.yaml 来直接导入 task 或 playbook 已经不推荐这么做，将来会被废弃

导入 playbook

即加载一个或多个play 导入playbook可以使用 import_playbook

yaml

---
  - name: first demo
    hosts: cloud
    vars:
      name: finley
    tasks:
      - name: execute date cmd
        shell: echo date
      - name: create hello
        shell: touch helloworld.txt
        args:
          creates: /tmp/hello.txt # 存在此文件就不执行 shell
      - include_tasks: tasks/task-hello.yml
  - import_playbook: playbooks/web.yml

参考

https://docs.ansible.com/ansible/latest/user_guide/playbooks_reuse.html

Jinja2

Sat, 13 Dec 2025 02:14:42 GMT

Jinja2

无论多么复杂的程序，都是由条件，循环，顺序执行三种组合而成，yaml 本身不支持逻辑运算，运算符等功能。 ansible支持Jinja2模板引擎。类似Laravel中的Blade模板引擎。

可以搜索 Online Jinja2 Parser 或在线体验 https://j2live.ttl255.com/

举个例子，创建 hello.yaml

yaml

- hosts: cloud
  remote_user: root
  vars:
    ports:
    - 8001
    - 8002
    nginx_conf_path: 'etc/nginx/nginx.conf'
  tasks:
  - name: hello
    tags: demo
    shell: echo "hello world"
  - name: date
    tags: date
    shell: date -R
  - name: jinja2 test
    template: 
      src: demo.j2 
      dest: demo.conf

demo.j2 内容

ninja2

# {{ "hello world" | reverse | upper }}

<p>{{ 'hello every one' | truncate(9)}}</p>

Hi, {{ name | default("mafei")}}

{# 我是注释 #}
{% filter upper %}
  hello world
{% endfilter %}

worker_processes {{ ansible_processor_vcpus }};

{# nginx.conf #}
{{nginx_conf_path | basename}}

{# etc/nginx #}
{{nginx_conf_path | dirname}}

{{ range(1, 51) | random }}

{% for port in ports %}
server {
	listen localhost:{{ port }};
}
{% endfor %}

{% if ansible_os_family == 'Debian' %}
# This is a debian system
{% endif %}

当执行ansible-playbook hello.yaml cloud服务器就会多出一个 demo.conf 文件，内容:

# DLROW OLLEH

<p>hello...</p>

Hi, mafei

  HELLO WORLD

worker_processes 2;

nginx.conf

etc/nginx

server {
	listen localhost:8001;
}
server {
	listen localhost:8002;
}

# This is a debian system

Role

role 需要一个特定的目录结构，执行时会自动加载定义好的文件如 vars_files,tasks,handles 等

通过role进行内容分组方便与其他用户分享role。

roles 可以解决文件混乱和 playbook 臃肿的问题

示例项目结构

site.yml
webservers.yml
fooservers.yml
roles/
   common/
     tasks/
     handlers/
     files/
     templates/
     vars/
     defaults/
     meta/
   webservers/
     tasks/
     defaults/
     meta/

tasks 目录：存放task列表。若role要生效，此目录必须要有一个主task文件main.yml，在main.yml中可以使用 include包含同目录(即tasks)中的其他文件。
handlers 目录: 存放handlers的目录，若要生效，则文件必须名为main.yml文件。
files目录：在task中执行copy或script模块时，如果使用的是相对路径，则会到此目录中寻找对应的文件。
templates 目录：在task中执行template模块时，如果使用的是相对路径，则会到此目录中寻找对应的模块文件。
vars目录：定义专属于该role的变量，如果要有var文件，则必须为main.yml文件。
defaults 目录：定义角色默认变量，角色默认变量的优先级最低，会被任意其他层次的同名变量覆盖。如果要有var文件，则必须为main.yml文件。
meta 目录：用于定义角色依赖(dependencies)，如果要有角色依赖关系，则文件必须为main.yml。

实例

执行命令

ansible-galaxy install geerlingguy.redis

roles目录中多个为geerlingguy.redis的目录。可以在各种操作系统安装redis。里面的 templates 目录中有redis.conf.j2文件，可以改变 redis 的配置。

我们可以研究别人写好的role

参考

https://www.kancloud.cn/willseecloud/ansible/2092474

ansible-vault

Sat, 13 Dec 2025 02:14:42 GMT

ansible-vault

可以加密解密 yaml 文件，加密时提供口令，解密时提供口令

bash

ansible-vault -h
usage: ansible-vault [-h] [--version] [-v] {create,decrypt,edit,view,encrypt,encrypt_string,rekey} ...

encryption/decryption utility for Ansible data files

positional arguments:
  {create,decrypt,edit,view,encrypt,encrypt_string,rekey}
    create              Create new vault encrypted file
    decrypt             Decrypt vault encrypted file
    edit                Edit vault encrypted file
    view                View vault encrypted file
    encrypt             Encrypt YAML file
    encrypt_string      Encrypt a string
    rekey               Re-key a vault encrypted file
    
# 加密文件，记住口令
ansible-vault encrypt  hello.yaml 
New Vault password: 
Confirm New Vault password: 
Encryption successful

Sat, 13 Dec 2025 02:14:42 GMT

运维自动化之ANSIBLE

Sat, 13 Dec 2025 02:14:42 GMT

运维自动化之ANSIBLE

本章内容

运维自动化发展历程及技术应用
Ansible命令使用
Ansible常用模块详解
YAML语法简介
Ansible playbook基础
Playbook变量、tags、handlers使用
Playbook模板templates
Playbook条件判断 when
Playbook字典 with_items
Ansible Roles

企业实际应用场景分析

Dev开发环境
    使用者：程序员
    功能：程序员开发软件，测试BUG的环境
    管理者：程序员

测试环境    
    使用者：QA测试工程师
    功能：测试经过Dev环境测试通过的软件的功能
    管理者：运维

说明：测试环境往往有多套,测试环境满足测试功能即可，不宜过多
1、测试人员希望测试环境有多套,公司的产品多产品线并发，即多个版本，意味着多个版本同步测试
2、通常测试环境有多少套和产品线数量保持一样

发布环境：代码发布机，有些公司为堡垒机（安全屏障）
    使用者：运维
    功能：发布代码至生产环境
    管理者：运维（有经验）
    发布机：往往需要有2台（主备）

生产环境
    使用者：运维，少数情况开放权限给核心开发人员，极少数公司将权限完全
    开放给开发人员并其维护
    功能：对用户提供公司产品的服务

管理者：只能是运维
    生产环境服务器数量：一般比较多，且应用非常重要。往往需要自动工具协助部署配置应用

灰度环境（生产环境的一部分）
    使用者：运维
    功能：在全量发布代码前将代码的功能面向少量精准用户发布的环境,可基
    于主机或用户执行灰度发布
    案例：共100台生产服务器，先发布其中的10台服务器，这10台服务器就是灰度服务器
    管理者：运维
    灰度环境：往往该版本功能变更较大，为保险起见特意先让一部分用户优化体验该功能，
              待这部分用户使用没有重大问题的时候，再全量发布至所有服务器

程序发布

程序发布要求：
    不能导致系统故障或造成系统完全不可用
    不能影响用户体验
预发布验证：
    新版本的代码先发布到服务器（跟线上环境配置完全相同，只是未接入到调度器）
灰度发布：
    基于主机，用户，业务
发布路径：
    /webapp/tuangou
    /webapp/tuangou-1.1
    /webapp/tuangou-1.2
发布过程：在调度器上下线一批主机(标记为maintanance状态) --> 关闭服务 -->
          部署新版本的应用程序 --> 启动服务 --> 在调度器上启用这一批服务器
自动化灰度发布：脚本、发布平台

自动化运维应用场景

文件传输
应用部署
配置管理
任务流编排

常用自动化运维工具

Ansible：python，Agentless，中小型应用环境
Saltstack：python，一般需部署agent，执行效率更高
Puppet：ruby, 功能强大，配置复杂，重型,适合大型环境
Fabric：python，agentless
Chef：ruby，国内应用少
Cfengine
func

企业级自动化运维工具应用实战ansible

公司计划在年底做一次大型市场促销活动，全面冲刺下交易额，为明年的上市做准备。
公司要求各业务组对年底大促做准备，运维部要求所有业务容量进行三倍的扩容，
并搭建出多套环境可以共开发和测试人员做测试，运维老大为了在年底有所表现，
要求运维部门同学尽快实现，当你接到这个任务时，有没有更快的解决方案？

Ansible发展史

Ansible
Michael DeHaan（ Cobbler 与 Func 作者）
名称来自《安德的游戏》中跨越时空的即时通信工具
2012-03-09，发布0.0.1版，2015-10-17，Red Hat宣布收购
官网：https://www.ansible.com/
官方文档：https://docs.ansible.com/
同类自动化工具GitHub关注程度（2016-07-10）

特性

1> 模块化：调用特定的模块，完成特定任务
2> Paramiko（python对ssh的实现），PyYAML，Jinja2（模板语言）三个关键模块
3> 支持自定义模块
4> 基于Python语言实现
5> 部署简单，基于python和SSH(默认已安装)，agentless
6> 安全，基于OpenSSH
7> 支持playbook编排任务
8> 幂等性：一个任务执行1遍和执行n遍效果一样，不因重复执行带来意外情况
9> 无需代理不依赖PKI（无需ssl）
10> 可使用任何编程语言写模块
11> YAML格式，编排任务，支持丰富的数据结构
12> 较强大的多层解决方案

ansible的作用以及工作结构
1、ansible简介：
ansible是新出现的自动化运维工具，基于Python开发，
集合了众多运维工具（puppet、cfengine、chef、func、fabric）的优点，
实现了批量系统配置、批量程序部署、批量运行命令等功能。
ansible是基于模块工作的，本身没有批量部署的能力。
真正具有批量部署的是ansible所运行的模块，ansible只是提供一种框架。
主要包括：
    (1)、连接插件connection plugins：负责和被监控端实现通信；
    (2)、host inventory：指定操作的主机，是一个配置文件里面定义监控的主机；
    (3)、各种模块核心模块、command模块、自定义模块；
    (4)、借助于插件完成记录日志邮件等功能；
    (5)、playbook：剧本执行多个任务时，非必需可以让节点一次性运行多个任务。

2、ansible的架构：连接其他主机默认使用ssh协议

Ansible主要组成部分

ANSIBLE PLAYBOOKS：任务剧本（任务集），编排定义Ansible任务集的配置文件，
                   由Ansible顺序依次执行，通常是JSON格式的YML文件
INVENTORY：Ansible管理主机的清单  /etc/anaible/hosts
MODULES：  Ansible执行命令的功能模块，多数为内置核心模块，也可自定义
PLUGINS：  模块功能的补充，如连接类型插件、循环插件、变量插件、过滤插件等，该功能不常用
API：      供第三方程序调用的应用程序编程接口 
ANSIBLE：  组合INVENTORY、API、MODULES、PLUGINS的绿框，可以理解为是ansible命令工具，其为核心执行工具

Ansible命令执行来源：
    1> USER，普通用户，即SYSTEM ADMINISTRATOR
    2> CMDB（配置管理数据库） API 调用
    3> PUBLIC/PRIVATE CLOUD API调用  (公有私有云的API接口调用)
    4> USER-> Ansible Playbook -> Ansibile

利用ansible实现管理的方式：
    1> Ad-Hoc 即ansible单条命令，主要用于临时命令使用场景
    2> Ansible-playbook 主要用于长期规划好的，大型项目的场景，需要有前期的规划过程

Ansible-playbook（剧本）执行过程
    将已有编排好的任务集写入Ansible-Playbook
    通过ansible-playbook命令分拆任务集至逐条ansible命令，按预定规则逐条执行

Ansible主要操作对象
   HOSTS主机
   NETWORKING网络设备

注意事项:
   执行ansible的主机一般称为主控端，中控，master或堡垒机
   主控端Python版本需要2.6或以上
   被控端Python版本小于2.4需要安装python-simplejson
   被控端如开启SELinux需要安装libselinux-python
   windows不能做为主控端
   ansible不是服务,不会一直启动,只是需要的时候启动

安装

rpm包安装: EPEL源
    yum install ansible

编译安装:
    yum -y install python-jinja2 PyYAML python-paramiko python-babel
    python-crypto
    tar xf ansible-1.5.4.tar.gz
    cd ansible-1.5.4
    python setup.py build
    python setup.py install
    mkdir /etc/ansible
    cp -r examples/* /etc/ansible


Git方式:
    git clone git://github.com/ansible/ansible.git --recursive
    cd ./ansible
    source ./hacking/env-setup

pip安装： pip是安装Python包的管理器，类似yum
    yum install python-pip python-devel
    yum install gcc glibc-devel zibl-devel rpm-bulid openssl-devel
    pip install --upgrade pip
    pip install ansible --upgrade

确认安装：
    ansible --version

主机清单inventory

Inventory 主机清单
1> ansible的主要功用在于批量主机操作，为了便捷地使用其中的部分主机，可以在inventory file中将其分组命名 
2> 默认的inventory file为/etc/ansible/hosts
3> inventory file可以有多个，且也可以通过Dynamic Inventory来动态生成

/etc/ansible/hosts文件格式
inventory文件遵循INI文件风格，中括号中的字符为组名。
可以将同一个主机同时归并到多个不同的组中；
此外，当如若目标主机使用了非默认的SSH端口，还可以在主机名称之后使用冒号加端口号来标明
    ntp.magedu.com   不分组,直接加
    
    [webservers]     webservers组
    www1.magedu.com:2222  可以指定端口
    www2.magedu.com
    
    [dbservers]
    db1.magedu.com
    db2.magedu.com
    db3.magedu.com

如果主机名称遵循相似的命名模式，还可以使用列表的方式标识各主机
示例：
    [websrvs]
    www[1:100].example.com   ip: 1-100
    
    [dbsrvs]
    db-[a:f].example.com     dba-dbff

ansible 配置文件

Ansible 配置文件/etc/ansible/ansible.cfg （一般保持默认）

vim /etc/ansible/ansible.cfg

[defaults]
#inventory     = /etc/ansible/hosts      # 主机列表配置文件
#library       = /usr/share/my_modules/  # 库文件存放目录
#remote_tmp    = $HOME/.ansible/tmp      # 临时py命令文件存放在远程主机目录
#local_tmp     = $HOME/.ansible/tmp      # 本机的临时命令执行目录  
#forks         = 5                       # 默认并发数,同时可以执行5次
#sudo_user     = root                    # 默认sudo 用户
#ask_sudo_pass = True                    # 每次执行ansible命令是否询问ssh密码
#ask_pass      = True                    # 每次执行ansible命令是否询问ssh口令
#remote_port   = 22                      # 远程主机的端口号(默认22)

建议优化项： 
host_key_checking = False               # 检查对应服务器的host_key，建议取消注释
log_path=/var/log/ansible.log           # 日志文件,建议取消注释
module_name   = command                 # 默认模块

ansible系列命令

Ansible系列命令
    ansible ansible-doc ansible-playbook ansible-vault ansible-console
    ansible-galaxy ansible-pull

ansible-doc: 显示模块帮助
    ansible-doc [options] [module...]
        -a            显示所有模块的文档
        -l, --list    列出可用模块
        -s, --snippet 显示指定模块的playbook片段(简化版,便于查找语法)

示例：
    ansible-doc -l      列出所有模块
    ansible-doc ping    查看指定模块帮助用法
    ansible-doc -s ping 查看指定模块帮助用法

ansible

ansible通过ssh实现配置管理、应用部署、任务执行等功能，
建议配置ansible端能基于密钥认证的方式联系各被管理节点

ansible <host-pattern> [-m module_name] [-a args]
ansible +被管理的主机(ALL) +模块  +参数
    --version              显示版本
    -m module              指定模块，默认为command
    -v                     详细过程 –vv -vvv更详细
    --list-hosts           显示主机列表，可简写 --list
    -k, --ask-pass         提示输入ssh连接密码,默认Key验证
    -C, --check            检查，并不执行
    -T, --timeout=TIMEOUT  执行命令的超时时间,默认10s
    -u, --user=REMOTE_USER 执行远程执行的用户
    -b, --become           代替旧版的sudo切换
        --become-user=USERNAME 指定sudo的runas用户,默认为root
    -K, --ask-become-pass  提示输入sudo时的口令

ansible all --list  列出所有主机
ping模块: 探测网络中被管理主机是否能够正常使用  走ssh协议
          如果对方主机网络正常,返回pong
ansible-doc -s ping   查看ping模块的语法 

检测所有主机的网络状态
1>  默认情况下连接被管理的主机是ssh基于key验证,如果没有配置key,权限将会被拒绝
    因此需要指定以谁的身份连接,输入用户密码,必须保证被管理主机用户密码一致
    ansible all -m ping -k

2> 或者实现基于key验证 将公钥ssh-copy-id到被管理的主机上 , 实现免密登录
   ansible all -m ping

ansible的Host-pattern

ansible的Host-pattern
匹配主机的列表
    All ：表示所有Inventory中的所有主机
        ansible all –m ping
    * :通配符
        ansible "*" -m ping  (*表示所有主机)
        ansible 192.168.1.* -m ping
        ansible "*srvs" -m ping
    或关系 ":"
        ansible "websrvs:appsrvs" -m ping
        ansible “192.168.1.10:192.168.1.20” -m ping
    逻辑与 ":&"
        ansible "websrvs:&dbsrvs" –m ping
        在websrvs组并且在dbsrvs组中的主机
    逻辑非 ":!"
        ansible 'websrvs:!dbsrvs' –m ping
        在websrvs组，但不在dbsrvs组中的主机
        注意：此处为单引号
    综合逻辑
        ansible 'websrvs:dbsrvs:&appsrvs:!ftpsrvs' –m ping
    正则表达式
        ansible "websrvs:&dbsrvs" –m ping
        ansible "~(web|db).*\.magedu\.com" –m ping

ansible命令执行过程

ansible命令执行过程
    1. 加载自己的配置文件 默认/etc/ansible/ansible.cfg
    2. 加载自己对应的模块文件，如command
    3. 通过ansible将模块或命令生成对应的临时py文件，
       并将该文件传输至远程服务器的对应执行用户$HOME/.ansible/tmp/ansible-tmp-数字/XXX.PY文件
    4. 给文件+x执行
    5. 执行并返回结果
    6. 删除临时py文件，sleep 0退出

执行状态：
    绿色：执行成功并且不需要做改变的操作
    黄色：执行成功并且对目标主机做变更
    红色：执行失败

ansible使用示例

示例
    以wang用户执行ping存活检测
        ansible all -m ping -u wang -k
    以wang sudo至root执行ping存活检测
        ansible all -m ping -u wang -k -b
    以wang sudo至mage用户执行ping存活检测
        ansible all -m ping -u wang -k -b --become-user=mage
    以wang sudo至root用户执行ls
        ansible all -m command -u wang -a 'ls /root' -b --become-user=root -k -K

ansible ping模块测试连接
    ansible 192.168.38.126,192.168.38.127 -m ping -k

ansible常用模块

模块文档：https://docs.ansible.com/ansible/latest/modules/modules_by_category.html

Command：在远程主机执行命令，默认模块，可忽略-m选项
    > ansible srvs -m command -a 'service vsftpd start'
    > ansible srvs -m command -a 'echo adong |passwd --stdin 123456'
此命令不支持 $VARNAME < > | ; & 等,用shell模块实现

    chdir:   进入到被管理主机目录
    creates: 如果有一个目录是存在的,步骤将不会运行Command命令
    ansible websrvs -a 'chdir=/data/ ls'

Shell：和command相似，用shell执行命令
    > ansible all -m shell  -a 'getenforce'  查看SELINUX状态
    >  ansible all -m shell  -a "sed -i 's/SELINUX=.*/SELINUX=disabled' /etc/selinux/config"
    > ansible srv -m shell -a 'echo magedu |passwd –stdin wang'
      
    调用bash执行命令 类似 cat /tmp/stanley.md | awk -F'|' '{print $1,$2}' &> /tmp/example.txt     
    这些复杂命令，即使使用shell也可能会失败，
    解决办法：写到脚本时，copy到远程执行，再把需要的结果拉回执行命令的机器

    修改配置文件,使shell作为默认模块    
        vim /etc/ansible/ansible.cfg
        module_name = shell

Script：在远程主机上运行ansible服务器上的脚本
    > -a "/PATH/TO/SCRIPT_FILE"
    > ansible websrvs -m script -a /data/test.sh

Copy：从主控端复制文件到远程主机
      src : 源文件  指定拷贝文件的本地路径  (如果有/ 则拷贝目录内容,比拷贝目录本身)
      dest: 指定目标路径
      mode: 设置权限
      backup: 备份源文件
      content: 代替src  指定本机文件内容,生成目标主机文件
      
      > ansible websrvs -m copy -a "src=/root/test1.sh dest=/tmp/test2.showner=wang mode=600 backup=yes"
        如果目标存在，默认覆盖，此处指定先备份
      > ansible websrvs -m copy -a "content='test content\nxxx' dest=/tmp/test.txt"
        指定内容，直接生成目标文件

Fetch：从远程主机提取文件至主控端，copy相反，目前不支持目录,可以先打包,再提取文件
     > ansible websrvs -m fetch -a 'src=/root/test.sh dest=/data/scripts'
     会生成每个被管理主机不同编号的目录,不会发生文件名冲突
     
     > ansible all -m shell -a 'tar jxvf test.tar.gz /root/test.sh'
     > ansible all -m fetch -a 'src=/root/test.tar.gz dest=/data/'

File：设置文件属性
    path: 要管理的文件路径 (强制添加)
    recurse: 递归,文件夹要用递归
    src:  创建硬链接,软链接时,指定源目标,配合'state=link' 'state=hard' 设置软链接,硬链接
    state: 状态
          absent 缺席,删除
          
    > ansible websrvs -m file -a 'path=/app/test.txt state=touch'       创建文件
    > ansible websrvs -m file -a "path=/data/testdir state=directory"   创建目录    
    > ansible websrvs -m file -a "path=/root/test.sh owner=wang mode=755"  设置权限755
    > ansible websrvs -m file -a 'src=/data/testfile dest=/data/testfile-link state=link' 创建软链接
    
    
unarchive：解包解压缩，有两种用法：
    1、将ansible主机上的压缩包传到远程主机后解压缩至特定目录，设置copy=yes.
    2、将远程主机上的某个压缩包解压缩到指定路径下，设置copy=no

    常见参数：
        copy：默认为yes，当copy=yes，拷贝的文件是从ansible主机复制到远程主机上，
              如果设置为copy=no，会在远程主机上寻找src源文件
        src： 源路径，可以是ansible主机上的路径，也可以是远程主机上的路径，
              如果是远程主机上的路径，则需要设置copy=no
        dest：远程主机上的目标路径
        mode：设置解压缩后的文件权限
    
    示例：
        ansible websrvs -m unarchive -a 'src=foo.tgz dest=/var/lib/foo'  
          #默认copy为yes ,将本机目录文件解压到目标主机对应目录下
        ansible websrvs -m unarchive -a 'src=/tmp/foo.zip dest=/data copy=no mode=0777'
          # 解压被管理主机的foo.zip到data目录下, 并设置权限777
        ansible websrvs -m unarchive -a 'src=https://example.com/example.zip dest=/data copy=no'

Archive：打包压缩
    > ansible all -m archive -a 'path=/etc/sysconfig dest=/data/sysconfig.tar.bz2 format=bz2 owner=wang mode=0777'
    将远程主机目录打包 
        path:   指定路径
        dest:   指定目标文件
        format: 指定打包格式
        owner:  指定所属者
        mode:   设置权限

Hostname：管理主机名
    ansible appsrvs -m hostname -a "name=app.adong.com"  更改一组的主机名
    ansible 192.168.38.103 -m hostname -a "name=app2.adong.com" 更改单个主机名

Cron：计划任务
    支持时间：minute,hour,day,month,weekday
    > ansible websrvs -m cron -a "minute=*/5 job='/usr/sbin/ntpdate 172.16.0.1 &>/dev/null' name=Synctime" 
    创建任务
    > ansible websrvs -m cron -a 'state=absent name=Synctime' 
    删除任务
    > ansible websrvs -m cron -a 'minute=*/10 job='/usr/sbin/ntpdate 172.30.0.100" name=synctime disabled=yes'
    注释任务,不在生效

Yum：管理包
    ansible websrvs -m yum -a 'list=httpd'  查看程序列表
    
    ansible websrvs -m yum -a 'name=httpd state=present' 安装
    ansible websrvs -m yum -a 'name=httpd state=absent'  删除
    可以同时安装多个程序包
    
Service：管理服务
    ansible srv -m service -a 'name=httpd state=stopped'  停止服务
    ansible srv -m service -a 'name=httpd state=started enabled=yes' 启动服务,并设为开机自启
    ansible srv -m service -a 'name=httpd state=reloaded'  重新加载
    ansible srv -m service -a 'name=httpd state=restarted' 重启服务

User：管理用户
    home   指定家目录路径
    system 指定系统账号
    group  指定组
    remove 清除账户
    shell  指定shell类型
    
    ansible websrvs -m user -a 'name=user1 comment="test user" uid=2048 home=/app/user1 group=root'
    ansible websrvs -m user -a 'name=sysuser1 system=yes home=/app/sysuser1'
    ansible websrvs -m user -a 'name=user1 state=absent remove=yes'  清空用户所有数据
    ansible websrvs -m user -a 'name=app uid=88 system=yes home=/app groups=root shell=/sbin/nologin password="$1$zfVojmPy$ZILcvxnXljvTI2PhP2Iqv1"'  创建用户
    ansible websrvs -m user -a 'name=app state=absent'  不会删除家目录
    
    安装mkpasswd 
    yum insatll expect 
    mkpasswd 生成口令
    openssl passwd -1  生成加密口令
    

删除用户及家目录等数据
    Group：管理组
        ansible srv -m group -a "name=testgroup system=yes"   创建组
        ansible srv -m group -a "name=testgroup state=absent" 删除组

ansible系列命令

可以通过网上写好的
ansible-galaxy
    > 连接 https://galaxy.ansible.com 
      下载相应的roles(角色)
    
    > 列出所有已安装的galaxy
        ansible-galaxy list
    
    > 安装galaxy
        ansible-galaxy install geerlingguy.redis
    
    > 删除galaxy
        ansible-galaxy remove geerlingguy.redis
        
ansible-pull
    推送命令至远程，效率无限提升，对运维要求较高
    

ansible-playbook  可以引用按照标准的yml语言写的脚本
    执行playbook
    示例：ansible-playbook hello.yml
        cat hello.yml
        #hello world yml file
        - hosts: websrvs
          remote_user: root
          tasks:
            - name: hello world
              command: /usr/bin/wall hello world

ansible-vault  (了解)
功能：管理加密解密yml文件
    ansible-vault [create|decrypt|edit|encrypt|rekey|view]
        ansible-vault encrypt hello.yml 加密
        ansible-vault decrypt hello.yml 解密
        ansible-vault view hello.yml    查看
        ansible-vault edit hello.yml    编辑加密文件
        ansible-vault rekey hello.yml   修改口令
        ansible-vault create new.yml    创建新文件


Ansible-console：2.0+新增，可交互执行命令，支持tab  (了解)

    root@test (2)[f:10] $
    执行用户@当前操作的主机组 (当前组的主机数量)[f:并发数]$

    设置并发数：         forks n   例如： forks 10
    切换组：             cd 主机组 例如： cd web
    列出当前组主机列表： list
    列出所有的内置命令： ?或help
    示例：
        root@all (2)[f:5]$ list
        root@all (2)[f:5]$ cd appsrvs
        root@appsrvs (2)[f:5]$ list
        root@appsrvs (2)[f:5]$ yum name=httpd state=present
        root@appsrvs (2)[f:5]$ service name=httpd state=started

playbook

> playbook是由一个或多个"play"组成的列表
> play的主要功能在于将预定义的一组主机，装扮成事先通过ansible中的task定义好的角色。
  Task实际是调用ansible的一个module，将多个play组织在一个playbook中，
  即可以让它们联合起来，按事先编排的机制执行预定义的动作
> Playbook采用YAML语言编写

playbook图解

用户通过 ansible 命令直接调用yml语言写好的 playbook,playbook 由多条 play 组成
每条play都有一个任务(task)相对应的操作,然后调用模块 modules，应用在主机清单上,通过 ssh 远程连接
从而控制远程主机或者网络设备

Playbook核心元素

Hosts          执行的远程主机列表(应用在哪些主机上)

Tasks          任务集

Variables      内置变量或自定义变量在playbook中调用

Templates模板  可替换模板文件中的变量并实现一些简单逻辑的文件

Handlers 和 notify 结合使用，由特定条件触发的操作，满足条件方才执行，否则不执行

tags标签       指定某条任务执行，用于选择运行playbook中的部分代码。
                ansible具有幂等性，因此会自动跳过没有变化的部分，
                即便如此，有些代码为测试其确实没有发生变化的时间依然会非常地长。
                此时，如果确信其没有变化，就可以通过tags跳过此些代码片断
                ansible-playbook -t tagsname useradd.yml

playbook基础组件

Hosts：
    > playbook中的每一个play的目的都是为了让特定主机以某个指定的用户身份执行任务。
      hosts用于指定要执行指定任务的主机，须事先定义在主机清单中

    > 可以是如下形式：
        one.example.com
        one.example.com:two.example.com
        192.168.1.50
        192.168.1.*
    > Websrvs:dbsrvs       或者，两个组的并集
    > Websrvs:&dbsrvs      与，两个组的交集
    > webservers:!phoenix  在websrvs组，但不在dbsrvs组
    示例: - hosts: websrvs：dbsrvs

remote_user: 
    可用于Host和task中。
    也可以通过指定其通过sudo的方式在远程主机上执行任务，其可用于play全局或某任务；
    此外，甚至可以在sudo时使用sudo_user指定sudo时切换的用户
    - hosts: websrvs
        remote_user: root   (可省略,默认为root)  以root身份连接
      tasks:    指定任务
    - name: test connection
        ping:
        remote_user: magedu
        sudo: yes           默认sudo为root
        sudo_user:wang      sudo为wang
    
task 列表和 action
    任务列表task:由多个动作,多个任务组合起来的,每个任务都调用的模块,一个模块一个模块执行
    1> play的主体部分是task list，task list中的各任务按次序逐个在hosts中指定的所有主机上执行，
       即在所有主机上完成第一个任务后，再开始第二个任务

    2> task的目的是使用指定的参数执行模块，而在模块参数中可以使用变量。
       模块执行是幂等的，这意味着多次执行是安全的，因为其结果均一致

    3> 每个task都应该有其name，用于playbook的执行结果输出，建议其内容能清晰地描述任务执行步骤。
       如果未提供name，则action的结果将用于输出

tasks：任务列表
两种格式：
    (1) action: module arguments
    (2) module: arguments 建议使用  模块: 参数
    注意：shell 和 command模块后面跟命令，而非key=value

某任务的状态在运行后为changed时，可通过"notify"通知给相应的handlers

任务可以通过"tags"打标签，可在ansible-playbook命令上使用-t指定进行调用
示例：
tasks:
  - name: disable selinux   描述
    command: /sbin/setenforce 0   模块名: 模块对应的参数

如果命令或脚本的退出码不为零，可以使用如下方式替代
tasks:
  - name: run this command and ignore the result
    shell: /usr/bin/somecommand || /bin/true  
    转错为正  如果命令失败则执行 true

或者使用ignore_errors来忽略错误信息
tasks:
  - name: run this command and ignore the result
    shell: /usr/bin/somecommand
    ignore_errors: True  忽略错误

运行playbook

运行playbook的方式
    ansible-playbook <filename.yml> ... [options]

常见选项
    --check -C       只检测可能会发生的改变，但不真正执行操作 
                     (只检查语法,如果执行过程中出现问题,-C无法检测出来)
                     (执行playbook生成的文件不存在,后面的程序如果依赖这些文件,也会导致检测失败)
    --list-hosts     列出运行任务的主机
    --list-tags      列出tag  (列出标签)
    --list-tasks     列出task (列出任务)
    --limit 主机列表 只针对主机列表中的主机执行
    -v -vv -vvv      显示过程

示例
    ansible-playbook hello.yml --check 只检测
    ansible-playbook hello.yml --list-hosts  显示运行任务的主机
    ansible-playbook hello.yml --limit websrvs  限制主机

Playbook VS ShellScripts

安装 httpd

SHELL脚本
#!/bin/bash
# 安装Apache
yum install --quiet -y httpd
# 复制配置文件
cp /tmp/httpd.conf /etc/httpd/conf/httpd.conf
cp/tmp/vhosts.conf /etc/httpd/conf.d/
# 启动Apache，并设置开机启动
service httpd start
chkconfig httpd on

Playbook定义
---
- hosts: all
  remote_user: root
  
  tasks:
    - name: "安装Apache"
      yum: name=httpd       yum模块:安装httpd
    - name: "复制配置文件"
      copy: src=/tmp/httpd.conf dest=/etc/httpd/conf/  copy模块: 拷贝文件
    - name: "复制配置文件"
      copy: src=/tmp/vhosts.conf dest=/etc/httpd/conf.d/  
    - name: "启动Apache，并设置开机启动"
      service: name=httpd state=started enabled=yes   service模块: 启动服务

示例:Playbook 创建用户

示例：sysuser.yml
---
- hosts: all
  remote_user: root

  tasks:
    - name: create mysql user
      user: name=mysql system=yes uid=36
    - name: create a group
      group: name=httpd system=yes

Playbook示例安装httpd服务

示例：httpd.yml
- hosts: websrvs
  remote_user: root

  tasks:
    - name: Install httpd
      yum: name=httpd state=present
    - name: Install configure file
      copy: src=files/httpd.conf dest=/etc/httpd/conf/
    - name: start service
      service: name=httpd state=started enabled=yes

Playbook示例安装nginx服务

示例 nginx.yml
- hosts: all
  remote_user: root

  tasks:
    - name: add group nginx
      user: name=nginx state=present
    - name: add user nginx
      user: name=nginx state=present group=nginx
    - name: Install Nginx
      yum: name=nginx state=present
    - name: Start Nginx
      service: name=nginx state=started enabled=yes

handlers 和 notify 结合使用触发条件

Handlers 实际上就是一个触发器
是 task 列表，这些 task 与前述的 task 并没有本质上的不同,用于当关注的资源发生变化时，才会采取一定的操作

Notify 此 action 可用于在每个 play 的最后被触发，
这样可避免多次有改变发生时每次都执行指定的操作，仅在所有的变化发生完成后一次性地执行指定操作。
在 notify 中列出的操作称为 handler，也即 notify 中调用 handler 中定义的操作

Playbook中 handlers 使用

- hosts: websrvs
  remote_user: root

  tasks:
    - name: Install httpd
      yum: name=httpd state=present
    - name: Install configure file
      copy: src=files/httpd.conf dest=/etc/httpd/conf/
      notify: restart httpd
    - name: ensure apache is running
      service: name=httpd state=started enabled=yes
  
  handlers:
    - name: restart httpd
      service: name=httpd state=restarted

示例

- hosts: webnodes
  vars:
    http_port: 80
    max_clients: 256
  remote_user: root
  
  tasks:
    - name: ensure apache is at the latest version
      yum: name=httpd state=latest
    - name: ensure apache is running
      service: name=httpd state=started
    - name: Install configure file
      copy: src=files/httpd.conf dest=/etc/httpd/conf/
      notify: restart httpd
  
  handlers:
      - name: restart httpd 
        service: name=httpd state=restarted

示例

- hosts: websrvs
  remote_user: root
  
  tasks:
    - name: add group nginx
      tags: user
      user: name=nginx state=present
    - name: add user nginx
      user: name=nginx state=present group=nginx
    - name: Install Nginx
      yum: name=nginx state=present
    - name: config
      copy: src=/root/config.txt dest=/etc/nginx/nginx.conf
      notify:
        - Restart Nginx
        - Check Nginx Process
  
  handlers:
    - name: Restart Nginx
      service: name=nginx state=restarted enabled=yes
    - name: Check Nginx process
      shell: killall -0 nginx > /tmp/nginx.log

Playbook中tags使用

tage: 添加标签 
可以指定某一个任务添加一个标签,添加标签以后,想执行某个动作可以做出挑选来执行
多个动作可以使用同一个标签

示例：httpd.yml
- hosts: websrvs
  remote_user: root
  
  tasks:
    - name: Install httpd
      yum: name=httpd state=present
      tags: install 
    - name: Install configure file
      copy: src=files/httpd.conf dest=/etc/httpd/conf/
      tags: conf
    - name: start httpd service
      tags: service
      service: name=httpd state=started enabled=yes

ansible-playbook –t install,conf httpd.yml   指定执行install,conf 两个标签

示例

//heartbeat.yaml
- hosts: hbhosts
  remote_user: root
  
  tasks:
    - name: ensure heartbeat latest version
      yum: name=heartbeat state=present
    - name: authkeys configure file
      copy: src=/root/hb_conf/authkeys dest=/etc/ha.d/authkeys
    - name: authkeys mode 600
      file: path=/etc/ha.d/authkeys mode=600
      notify:
        - restart heartbeat
    - name: ha.cf configure file
      copy: src=/root/hb_conf/ha.cf dest=/etc/ha.d/ha.cf
      notify:
        - restart heartbeat
  handlers:
    - name: restart heartbeat
      service: name=heartbeat state=restarted

Playbook 中 tags 使用

- hosts: testsrv
  remote_user: root
  tags: inshttpd   针对整个playbook添加tage
  tasks:
    - name: Install httpd
      yum: name=httpd state=present
    - name: Install configure file
      copy: src=files/httpd.conf dest=/etc/httpd/conf/
      tags: rshttpd
      notify: restart httpd
  handlers:
    - name: restart httpd
      service: name=httpd status=restarted
     
ansible-playbook –t rshttpd httpd2.yml

Playbook 中变量的使用

变量名：仅能由字母、数字和下划线组成，且只能以字母开头
变量来源：
    1> ansible setup facts 远程主机的所有变量都可直接调用 (系统自带变量)
       setup模块可以实现系统中很多系统信息的显示
                可以返回每个主机的系统信息包括:版本、主机名、cpu、内存
       ansible all -m setup -a 'filter="ansible_nodename"'     查询主机名
       ansible all -m setup -a 'filter="ansible_memtotal_mb"'  查询主机内存大小
       ansible all -m setup -a 'filter="ansible_distribution_major_version"'  查询系统版本
       ansible all -m setup -a 'filter="ansible_processor_vcpus"' 查询主机cpu个数
    
    2> 在/etc/ansible/hosts(主机清单)中定义变量
        普通变量：主机组中主机单独定义，优先级高于公共变量(单个主机 )
        公共(组)变量：针对主机组中所有主机定义统一变量(一组主机的同一类别)
    
    3> 通过命令行指定变量，优先级最高
       ansible-playbook –e varname=value
    
    4> 在playbook中定义
       vars:
        - var1: value1
        - var2: value2
    
    5> 在独立的变量YAML文件中定义
    
    6> 在role中定义

变量命名:
    变量名仅能由字母、数字和下划线组成，且只能以字母开头

变量定义：key=value
    示例：http_port=80

变量调用方式：
    1> 通过{{ variable_name }} 调用变量，且变量名前后必须有空格，有时用“{{ variable_name }}”才生效

    2> ansible-playbook –e 选项指定
       ansible-playbook test.yml -e "hosts=www user=magedu"

在主机清单中定义变量,在ansible中使用变量
vim /etc/ansible/hosts
[appsrvs]
192.168.38.17 http_port=817 name=www
192.168.38.27 http_port=827 name=web

调用变量
ansible appsrvs -m hostname -a'name={{name}}'  更改主机名为各自被定义的变量 

针对一组设置变量
[appsrvs:vars]
make="-"

ansible appsrvs -m hostname -a 'name={{name}}{{mark}}{{http_port}}'  ansible调用变量

将变量写进单独的配置文件中引用
vim vars.yml
pack: vsftpd
service: vsftpd

引用变量文件
vars_files:
  - vars.yml

Ansible基础元素

Facts：是由正在通信的远程目标主机发回的信息，这些信息被保存在ansible变量中。
       要获取指定的远程主机所支持的所有facts，可使用如下命令进行
       ansible websrvs -m setup

通过命令行传递变量
    在运行playbook的时候也可以传递一些变量供playbook使用
    示例：
        ansible-playbook test.yml -e "hosts=www user=magedu"
        
register
把任务的输出定义为变量，然后用于其他任务

示例:
tasks:
- shell: /usr/bin/foo
  register: foo_result
  ignore_errors: True

示例：使用setup变量

示例：var.yml
- hosts: websrvs
  remote_user: root
  tasks:
    - name: create log file
      file: name=/var/log/ {{ ansible_fqdn }} state=touch

ansible-playbook var.yml

示例：变量

示例：var.yml
- hosts: websrvs
  remote_user: root
  tasks:
    - name: install package
      yum: name={{ pkname }} state=present
      
ansible-playbook –e pkname=httpd var.yml

示例：变量

示例：var.yml
- hosts: websrvs
  remote_user: root
vars:
  - username: user1
  - groupname: group1
tasks:
  - name: create group
    group: name={{ groupname }} state=present
  - name: create user
    user: name={{ username }} state=present

ansible-playbook var.yml
ansible-playbook -e "username=user2 groupname=group2” var2.yml

变量

主机变量
可以在inventory中定义主机时为其添加主机变量以便于在playbook中使用

示例：
[websrvs]
www1.magedu.com http_port=80 maxRequestsPerChild=808
www2.magedu.com http_port=8080 maxRequestsPerChild=909

组变量
组变量是指赋予给指定组内所有主机上的在playbook中可用的变量

示例：
    [websrvs]
    www1.magedu.com
    www2.magedu.com

    [websrvs:vars]
    ntp_server=ntp.magedu.com
    nfs_server=nfs.magedu.com

示例：变量

普通变量
    [websrvs]
    192.168.99.101 http_port=8080 hname=www1
    192.168.99.102 http_port=80 hname=www2

公共（组）变量
    [websvrs:vars]
    http_port=808
    mark="_"
    [websrvs]
    192.168.99.101 http_port=8080 hname=www1
    192.168.99.102 http_port=80 hname=www2
    ansible websvrs –m hostname –a ‘name={{ hname }}{{ mark }}{{ http_port }}’

命令行指定变量：
    ansible websvrs –e http_port=8000 –m hostname –a'name={{ hname }}{{ mark }}{{ http_port }}'

使用变量文件

cat vars.yml
var1: httpd
var2: nginx

cat var.yml
- hosts: web
  remote_user: root
  vars_files:
    - vars.yml
  tasks:
    - name: create httpd log
      file: name=/app/{{ var1 }}.log state=touch
    - name: create nginx log
      file: name=/app/{{ var2 }}.log state=touch
      
hostname app_81.magedu.com  hostname 不支持"_",认为"_"是非法字符
hostnamectl set-hostname app_80.magedu.com  可以更改主机名

变量

组嵌套
inventory中，组还可以包含其它的组，并且也可以向组中的主机指定变量。
这些变量只能在ansible-playbook中使用，而ansible命令不支持

示例：
    [apache]
    httpd1.magedu.com
    httpd2.magedu.com
    
    [nginx]
    ngx1.magedu.com
    ngx2.magedu.com
    
    [websrvs:children]
    apache
    nginx
    
    [webservers:vars]
    ntp_server=ntp.magedu.com

inventory 参数

invertory 参数：用于定义ansible远程连接目标主机时使用的参数，而非传递给playbook的变量
    ansible_ssh_host
    ansible_ssh_port
    ansible_ssh_user
    ansible_ssh_pass
    ansbile_sudo_pass

示例：
    cat /etc/ansible/hosts
    [websrvs]
    192.168.0.1 ansible_ssh_user=root ansible_ssh_pass=magedu
    192.168.0.2 ansible_ssh_user=root ansible_ssh_pass=magedu

inventory 参数

inventory参数
ansible基于ssh连接inventory中指定的远程主机时，还可以通过参数指定其交互方式；
这些参数如下所示：
ansible_ssh_host
The name of the host to connect to, if different from the alias you wishto give to it.

ansible_ssh_port
The ssh port number, if not 22

ansible_ssh_user
The default ssh user name to use.

ansible_ssh_pass
The ssh password to use (this is insecure, we strongly recommendusing --ask-pass or SSH keys)

ansible_sudo_pass
The sudo password to use (this is insecure, we strongly recommendusing --ask-sudo-pass)

ansible_connection
Connection type of the host. Candidates are local, ssh or paramiko.
The default is paramiko before Ansible 1.2, and 'smart' afterwards which
detects whether usage of 'ssh' would be feasible based on whether
ControlPersist is supported.

ansible_ssh_private_key_file
Private key file used by ssh. Useful if using multiple keys and you don't want to use SSH agent.

ansible_shell_type
The shell type of the target system. By default commands are formatted
using 'sh'-style syntax by default. Setting this to 'csh' or 'fish' will cause
commands executed on target systems to follow those shell's syntax instead.

ansible_python_interpreter
The target host python path. This is useful for systems with more
than one Python or not located at "/usr/bin/python" such as \*BSD, or where /usr/bin/python

is not a 2.X series Python. We do not use the "/usr/bin/env" mechanism as that requires the remote user's

path to be set right and also assumes the "python" executable is named python,where the executable might

be named something like "python26".
ansible\_\*\_interpreter

Works for anything such as ruby or perl and works just like ansible_python_interpreter.

This replaces shebang of modules which will run on that host.

模板 templates

文本文件，嵌套有脚本（使用模板编程语言编写） 借助模板生成真正的文件
Jinja2语言，使用字面量，有下面形式
    字符串：使用单引号或双引号
    数字：整数，浮点数
    列表：[item1, item2, ...]
    元组：(item1, item2, ...)
    字典：{key1:value1, key2:value2, ...}
    布尔型：true/false
算术运算：+, -, *, /, //, %, **
比较操作：==, !=, >, >=, <, <=
逻辑运算：and，or，not
流表达式：For，If，When

Jinja2相关

字面量
    1> 表达式最简单的形式就是字面量。字面量表示诸如字符串和数值的 Python对象。如“Hello World”
    双引号或单引号中间的一切都是字符串。
    2> 无论何时你需要在模板中使用一个字符串（比如函数调用、过滤器或只是包含或继承一个模板的参数），如4242.23
    3> 数值可以为整数和浮点数。如果有小数点，则为浮点数，否则为整数。在Python 里， 42 和 42.0 是不一样的

Jinja2:算术运算

算术运算
Jinja 允许你用计算值。这在模板中很少用到，但为了完整性允许其存在
支持下面的运算符
    +：把两个对象加到一起。
       通常对象是素质，但是如果两者是字符串或列表，你可以用这 种方式来衔接它们。
       无论如何这不是首选的连接字符串的方式！连接字符串见 ~ 运算符。 {{ 1 + 1 }} 等于 2
    -：用第一个数减去第二个数。 {{ 3 - 2 }} 等于 1
    /：对两个数做除法。返回值会是一个浮点数。 {{ 1 / 2 }} 等于 {{ 0.5 }}
    //：对两个数做除法，返回整数商。 {{ 20 // 7 }} 等于 2
    %：计算整数除法的余数。 {{ 11 % 7 }} 等于 4
    *：用右边的数乘左边的操作数。 {{ 2 * 2 }} 会返回 4 。
       也可以用于重 复一个字符串多次。{{ ‘=’ * 80 }} 会打印 80 个等号的横条
    **：取左操作数的右操作数次幂。 {{ 2**3 }} 会返回 8

Jinja2

比较操作符
== 比较两个对象是否相等
!= 比较两个对象是否不等
> 如果左边大于右边，返回 true
>= 如果左边大于等于右边，返回 true
< 如果左边小于右边，返回 true
<= 如果左边小于等于右边，返回 true

逻辑运算符
对于 if 语句，在 for 过滤或 if 表达式中，它可以用于联合多个表达式
and
    如果左操作数和右操作数同为真，返回 true
or
    如果左操作数和右操作数有一个为真，返回 true
not
    对一个表达式取反（见下）
(expr)
    表达式组

['list', 'of', 'objects']:
一对中括号括起来的东西是一个列表。列表用于存储和迭代序列化的数据。
例如 你可以容易地在 for循环中用列表和元组创建一个链接的列表
    <ul>
    {% for href, caption in [('index.html', 'Index'), ('about.html', 'About'), ('downloads.html',
'Downloads')] %}
        <li><a href="proxy.php?url={{ href }}">{{ caption }}</a></li>
    {% endfor %}
    </ul>
    ('tuple', 'of', 'values'):

元组与列表类似，只是你不能修改元组。
如果元组中只有一个项，你需要以逗号结尾它。
元组通常用于表示两个或更多元素的项。更多细节见上面的例子
    {'dict': 'of', 'key': 'and', 'value': 'pairs'}:

Python 中的字典是一种关联键和值的结构。
键必须是唯一的，并且键必须只有一个 值。
字典在模板中很少使用，罕用于诸如 xmlattr() 过滤器之类
    true / false:
    true 永远是 true ，而 false 始终是 false

template 的使用

template功能：根据模块文件动态生成对应的配置文件
   > template文件必须存放于templates目录下，且命名为 .j2 结尾
   > yaml/yml 文件需和templates目录平级，目录结构如下：
    ./
     ├── temnginx.yml
     └── templates
        └── nginx.conf.j2

template示例

示例：利用template 同步nginx配置文件
准备templates/nginx.conf.j2文件
vim temnginx.yml
- hosts: websrvs
  remote_user: root
  
  tasks:
    - name: template config to remote hosts
      template: src=nginx.conf.j2 dest=/etc/nginx/nginx.conf

ansible-playbook temnginx.yml

Playbook 中 template 变更替换

修改文件nginx.conf.j2 下面行为
worker_processes {{ ansible_processor_vcpus }};

cat temnginx2.yml
- hosts: websrvs
  remote_user: root
  tasks:
    - name: template config to remote hosts
      template: src=nginx.conf.j2 dest=/etc/nginx/nginx.conf

ansible-playbook temnginx2.yml

Playbook中template算术运算

算法运算：
示例：
    vim nginx.conf.j2
    worker_processes {{ ansible_processor_vcpus**2 }};
    worker_processes {{ ansible_processor_vcpus+2 }};

when 实现条件判断

条件测试:如果需要根据变量、facts或此前任务的执行结果来做为某task执行与否的前提时要用到条件测试,
通过when语句实现，在task中使用，jinja2的语法格式

when语句
    在task后添加when子句即可使用条件测试；when语句支持Jinja2表达式语法
示例：
tasks:
  - name: "shutdown RedHat flavored systems"
    command: /sbin/shutdown -h now
    when: ansible_os_family == "RedHat"  当系统属于红帽系列,执行command模块 
 
when语句中还可以使用Jinja2的大多"filter"，
例如要忽略此前某语句的错误并基于其结果(failed或者success)运行后面指定的语句，
可使用类似如下形式：
tasks:
  - command: /bin/false
    register: result
    ignore_errors: True
  - command: /bin/something
    when: result|failed
  - command: /bin/something_else
    when: result|success
  - command: /bin/still/something_else
    when: result|skipped

此外，when语句中还可以使用facts或playbook中定义的变量

示例：when 条件判断

- hosts: websrvs
  remote_user: root
  tasks:
    - name: add group nginx
      tags: user
      user: name=nginx state=present
    - name: add user nginx
      user: name=nginx state=present group=nginx
    - name: Install Nginx
      yum: name=nginx state=present
    - name: restart Nginx
      service: name=nginx state=restarted
      when: ansible_distribution_major_version == "6"

示例：when 条件判断

示例：
tasks:
  - name: install conf file to centos7
    template: src=nginx.conf.c7.j2 dest=/etc/nginx/nginx.conf
    when: ansible_distribution_major_version == "7"
  - name: install conf file to centos6
    template: src=nginx.conf.c6.j2 dest=/etc/nginx/nginx.conf
    when: ansible_distribution_major_version == "6"

Playbook 中 when 条件判断

---
- hosts: srv120
  remote_user: root
  tasks:
    - name:
      template: src=nginx.conf.j2 dest=/etc/nginx/nginx.conf
      when: ansible_distribution_major_version == "7"

迭代：with_items

迭代：当有需要重复性执行的任务时，可以使用迭代机制
    > 对迭代项的引用，固定变量名为"item"
    > 要在task中使用with_items给定要迭代的元素列表
    > 列表格式：
         字符串
         字典

示例

示例： 创建用户
- name: add several users
  user: name={{ item }} state=present groups=wheel   #{{ item }} 系统自定义变量
  with_items:       # 定义{{ item }} 的值和个数
    - testuser1
    - testuser2

上面语句的功能等同于下面的语句：
- name: add user testuser1
  user: name=testuser1 state=present groups=wheel
- name: add user testuser2
  user: name=testuser2 state=present groups=wheel
  
with_items中可以使用元素还可为hashes
示例：
- name: add several users
  user: name={{ item.name }} state=present groups={{ item.groups }}
  with_items:
    - { name: 'testuser1', groups: 'wheel' }
    - { name: 'testuser2', groups: 'root' }

ansible的循环机制还有更多的高级功能，具体请参见官方文档
http://docs.ansible.com/playbooks_loops.html

示例：迭代

示例：将多个文件进行copy到被控端
---
- hosts: testsrv
  remote_user: root
  tasks
  - name: Create rsyncd config
    copy: src={{ item }} dest=/etc/{{ item }}
    with_items:
  - rsyncd.secrets
  - rsyncd.conf

示例：迭代

- hosts: websrvs
  remote_user: root
  tasks:
    - name: copy file
      copy: src={{ item }} dest=/tmp/{{ item }}
      with_items:
    - file1
    - file2
    - file3
- name: yum install httpd
  yum: name={{ item }} state=present
  with_items:
    - apr
    - apr-util
    - httpd

示例：迭代

- hosts：websrvs
  remote_user: root
  tasks
    - name: install some packages
      yum: name={{ item }} state=present
      with_items:
        - nginx
        - memcached
        - php-fpm

示例：迭代嵌套子变量

- hosts：websrvs
  remote_user: root
  
  tasks:
    - name: add some groups
      group: name={{ item }} state=present
      with_items:
        - group1
        - group2
        - group3
    - name: add some users
      user: name={{ item.name }} group={{ item.group }} state=present
      with_items:
        - { name: 'user1', group: 'group1' }
        - { name: 'user2', group: 'group2' }
        - { name: 'user3', group: 'group3' }

with_items 嵌套子变量

with_itmes 嵌套子变量
示例
---
- hosts: testweb
  remote_user: root
  tasks:
    - name: add several users
      user: name={{ item.name }} state=present groups={{ item.groups }}
      with_items:
    - { name: 'testuser1' , groups: 'wheel'}
    - { name: 'testuser2' , groups: 'root'}

Playbook字典 with_items

- name: 使用ufw模块来管理哪些端口需要开启
  ufw:
  rule: “{{ item.rule }}”
  port: “{{ item.port }}”
  proto: “{{ item.proto }}”
  with_items:
    - { rule: 'allow', port: 22, proto: 'tcp' }
    - { rule: 'allow', port: 80, proto: 'tcp' }
    - { rule: 'allow', port: 123, proto: 'udp' }

- name: 配置网络进出方向的默认规则
  ufw:
  direction: "{{ item.direction }}"
  policy: "{{ item.policy }}"
  state: enabled
  with_items:
    - { direction: outgoing, policy: allow }
    - { direction: incoming, policy: deny }

Playbook 中 template for if when 循环

{% for vhost in nginx_vhosts %}

server {    #重复执行server代码
listen {{ vhost.listen | default('80 default_server') }};

{% if vhost.server_name is defined %}
server_name {{ vhost.server_name }};
{% endif %}

{% if vhost.root is defined %}
root {{ vhost.root }};
{% endif %}

{% endfor %}

示例

// temnginx.yml
---
- hosts: testweb
  remote_user: root
  vars:      # 调用变量
    nginx_vhosts:
      - listen: 8080  #列表 键值对


//templates/nginx.conf.j2
{% for vhost in nginx_vhosts %}  
server {
  listen {{ vhost.listen }}
}
{% endfor %}

生成的结果
server {
  listen 8080
}

示例

// temnginx.yml
---
- hosts: mageduweb
  remote_user: root
  vars:
    nginx_vhosts:
      - web1
      - web2
      - web3
  tasks:
    - name: template config
      template: src=nginx.conf.j2 dest=/etc/nginx/nginx.conf

// templates/nginx.conf.j2
{% for vhost in nginx_vhosts %}
server {
    listen {{ vhost }}
}
{% endfor %}

生成的结果：
server {
    listen web1
}
server {
    listen web2
}
server {
    listen web3
}

roles

roles
    ansible自1.2版本引入的新特性，用于层次性、结构化地组织playbook。
    roles能够根据层次型结构自动装载变量文件、tasks以及handlers等。
    要使用roles只需要在playbook中使用include指令即可。
    简单来讲，roles就是通过分别将变量、文件、任务、模板及处理器放置于单独的目录中，
    并可以便捷地include它们的一种机制。
    角色一般用于基于主机构建服务的场景中，但也可以是用于构建守护进程等场景中

复杂场景：建议使用roles，代码复用度高
    变更指定主机或主机组
    如命名不规范维护和传承成本大
    某些功能需多个Playbook，通过includes即可实现

Roles

角色(roles)：角色集合
roles/
    mysql/
    httpd/
    nginx/
    memcached/
    
可以互相调用

roles目录结构

每个角色，以特定的层级目录结构进行组织
roles目录结构：

playbook.yml  调用角色
roles/
  project/ (角色名称)
    tasks/
    files/
    vars/
    templates/
    handlers/
    default/ 不常用
    meta/    不常用

Roles各目录作用

/roles/project/ :项目名称,有以下子目录
    files/ ：存放由copy或script模块等调用的文件
    templates/：template模块查找所需要模板文件的目录
    tasks/：定义task,role的基本元素，至少应该包含一个名为main.yml的文件；
            其它的文件需要在此文件中通过include进行包含
    handlers/：至少应该包含一个名为main.yml的文件；
               其它的文件需要在此文件中通过include进行包含
    vars/：定义变量，至少应该包含一个名为main.yml的文件；
           其它的文件需要在此文件中通过include进行包含
    meta/：定义当前角色的特殊设定及其依赖关系,至少应该包含一个名为main.yml的文件，
           其它文件需在此文件中通过include进行包含
    default/：设定默认变量时使用此目录中的main.yml文件
    
roles/appname 目录结构
    tasks目录：至少应该包含一个名为main.yml的文件，其定义了此角色的任务列表；
               此文件可以使用include包含其它的位于此目录中的task文件
    files目录：存放由copy或script等模块调用的文件；
    templates目录：template模块会自动在此目录中寻找Jinja2模板文件
    handlers目录：此目录中应当包含一个main.yml文件，用于定义此角色用到的各handler；
                  在handler中使用include包含的其它的handler文件也应该位于此目录中；
    vars目录：应当包含一个main.yml文件，用于定义此角色用到的变量；
    meta目录：应当包含一个main.yml文件，用于定义此角色的特殊设定及其依赖关系；
              ansible1.3及其以后的版本才支持；
    default目录：为当前角色设定默认变量时使用此目录；应当包含一个main.yml文件

roles/example_role/files/             所有文件，都将可存放在这里
roles/example_role/templates/         所有模板都存放在这里
roles/example_role/tasks/main.yml：   主函数，包括在其中的所有任务将被执行
roles/example_role/handlers/main.yml：所有包括其中的 handlers 将被执行
roles/example_role/vars/main.yml：    所有包括在其中的变量将在roles中生效
roles/example_role/meta/main.yml：    roles所有依赖将被正常登入

创建role

创建role的步骤
(1) 创建以roles命名的目录
(2) 在roles目录中分别创建以各角色名称命名的目录，如webservers等
(3) 在每个角色命名的目录中分别创建files、handlers、meta、tasks、templates和vars目录；
    用不到的目录可以创建为空目录，也可以不创建
(4) 在playbook文件中，调用各角色

实验: 创建 httpd 角色

1> 创建 roles 目录
   mkdir roles/{httpd,mysql,redis}/tasks -pv
   mkdir roles/httpd/{handlers,files}

查看目录结构
tree roles/
    roles/
    ├── httpd
    │   ├── files
    │   ├── handlers
    │   └── tasks
    ├── mysql
    │   └── tasks
    └── redis
        └── tasks

2> 创建目标文件
   cd roles/httpd/tasks/
   touch install.yml config.yml service.yml

3> vim install.yml
   - name: install httpd package
     yum: name=httpd
     
   vim config.yml
   - name: config file  
     copy: src=httpd.conf dest=/etc/httpd/conf/ backup=yes 
   
   vim service.yml
   - name: start service 
     service: name=httpd state=started enabled=yes
     
4> 创建main.yml主控文件,调用以上单独的yml文件,
   main.yml定义了谁先执行谁后执行的顺序
   vim main.yml
   - include: install.yml
   - include: config.yml
   - include: service.yml
   
5> 准备httpd.conf文件,放到httpd单独的文件目录下
   cp /app/ansible/flies/httpd.conf ../files/
   
6> 创建一个网页
   vim files/index.html
   <h1> welcome to weixiaodong home <\h1>

7> 创建网页的yml文件
   vim tasks/index.yml
   - name: index.html
     copy: src=index.html dest=/var/www/html 

8> 将网页的yml文件写进mian.yml文件中
   vim mian.yml
   - include: install.yml
   - include: config.yml
   - include: index.yml
   - include: service.yml

9> 在handlers目录下创建handler文件mian.yml
   vim handlers/main.yml
   - name: restart service httpd
     service: name=httpd state=restarted

10> 创建文件调用httpd角色
    cd /app/ansidle/roles
    vim role_httpd.yml
    ---
    # httpd role
    - hosts: appsrvs
      remote_user: root 

      roles:       #调用角色
        - role: httpd  
        
11> 查看目录结构
    tree 
    .
    httpd
    ├── files
    │   ├── httpd.conf
    │   └── index.html
    ├── handlers
    │   └── main.yml
    └── tasks
        ├── config.yml
        ├── index.yml
        ├── install.yml
        ├── main.yml
        └── service.yml

12> ansible-playbook role_httpd.yml

针对大型项目使用Roles进行编排

roles目录结构：
playbook.yml
roles/
  project/
    tasks/
    files/
    vars/
    templates/
    handlers/
    default/ # 不经常用
    meta/    # 不经常用

示例：
nginx-role.yml
roles/
└── nginx
    ├── files
    │ └── main.yml
    ├── tasks
    │ ├── groupadd.yml
    │ ├── install.yml
    │ ├── main.yml
    │ ├── restart.yml
    │ └── useradd.yml
    └── vars
        └── main.yml

示例

roles的示例如下所示：
site.yml
webservers.yml
dbservers.yml
roles/
  common/
    files/
    templates/
    tasks/
    handlers/
    vars/
    meta/
  webservers/
    files/
    templates/
    tasks/
  handlers/
    vars/
    meta/

实验：创建一个nginx角色

建立nginx角色在多台主机上来部署nginx需要安装 创建账号
1> 创建nginx角色目录
     cd /app/ansible/role
     mkdir nginx{tesks,templates,hanslers} -pv

2> 创建任务目录
     cd tasks/
     touch insatll.yml config.yml service.yml file.yml user.yml
   创建main.yml文件定义任务执行顺序
     vim main.yml
     - include: user.yml
     - include: insatll.yml
     - include: config.yml
     - include: file.yml
     - include: service.yml

  
3> 准备配置文件(centos7、8)
   ll /app/ansible/role/nginx/templates/
   nginx7.conf.j2
   nginx8.conf.j2


4> 定义任务
   vim tasks/install.yml
   - name: install
     yum: name=nginx
     
   vim tasks/config.yml
    - name: config file
      template: src=nginx7.conf.j2 dest=/etc/nginx/nginx.conf
      when: ansible_distribution_major_version=="7"
      notify: restrat
      
    - name: config file
      template: src=nginx8.conf.j2 dest=/etc/nginx/nginx.conf
      when: ansible_distribution_major_version=="8"
      notify: restrat
      
    vim tasks/file.yml   跨角色调用file.yum文件,实现文件复用
    - name: index.html
      copy: src=roles/httpd/files/index.html dest=/usr/share/nginx/html/ 
   
    vim tasks/service.yml
    - nmae: start service
      service: name=nginx state=started enabled=yes
      
    vim handlers/main.yml
    - name: restrat
      service: name=nginx state=restarted
      
    vim roles/role_nginix.yml
    --- 
    #test rcle
    - hosts: appsrvs
    
      roles: 
        - role: nginx
        
5> 测试安装
   ansible-playbook role_nginx.yml

playbook调用角色

调用角色方法1：
- hosts: websrvs
  remote_user: root
  
  roles:
    - mysql
    - memcached
    - nginx
    
调用角色方法2：
传递变量给角色
- hosts:
  remote_user:
  roles:
    - mysql
    - { role: nginx, username: nginx }   #不同的角色调用不同的变量  
    键role用于指定角色名称
    后续的k/v用于传递变量给角色

调用角色方法3：还可基于条件测试实现角色调用
roles:
  - { role: nginx, username: nginx, when: ansible_distribution_major_version == '7' }

通过roles传递变量

通过roles传递变量
当给一个主机应用角色的时候可以传递变量，然后在角色内使用这些变量
示例：
- hosts: webservers
  roles:
    - common
    - { role: foo_app_instance, dir: '/web/htdocs/a.com', port: 8080 }

向roles传递参数

而在playbook中，可以这样使用roles：
---
- hosts: webservers
  roles:
    - common
    - webservers

也可以向roles传递参数
示例：
---
- hosts: webservers
  roles:
    - common
    - { role: foo_app_instance, dir: '/opt/a', port: 5000 }
    - { role: foo_app_instance, dir: '/opt/b', port: 5001 }

条件式地使用roles

甚至也可以条件式地使用roles
示例：
---
- hosts: webservers
  roles:
    - { role: some_role, when: "ansible_os_family == 'RedHat'" }

Roles条件及变量等案例

When条件
    roles:
      - {role: nginx, when: "ansible_distribution_major_version == '7' " ,username: nginx }
变量调用
- hosts: zabbix-proxy
  sudo: yes
  roles:
    - { role: geerlingguy.php-mysql }
    - { role: dj-wasabi.zabbix-proxy, zabbix_server_host: 192.168.37.167 }

完整的roles架构

yaml

// nginx-role.yml 顶层任务调用yml文件
---
- hosts: testweb
  remote_user: root
  roles:
    - role: nginx
    - role: httpd 可执行多个role

cat roles/nginx/tasks/main.yml
---
- include: groupadd.yml
- include: useradd.yml
- include: install.yml
- include: restart.yml
- include: filecp.yml

// roles/nginx/tasks/groupadd.yml
---
- name: add group nginx
  user: name=nginx state=present

cat roles/nginx/tasks/filecp.yml
---
- name: file copy
  copy: src=tom.conf dest=/tmp/tom.conf

以下文件格式类似：
useradd.yml,install.yml,restart.yml

ls roles/nginx/files/
tom.conf

roles playbook tags使用

roles playbook tags使用
    ansible-playbook --tags="nginx,httpd,mysql" nginx-role.yml  对标签进行挑选执行

// nginx-role.yml
---
- hosts: testweb
  remote_user: root
  roles:
    - { role: nginx ,tags: [ 'nginx', 'web' ] ,when: ansible_distribution_major_version == "6“ }
    - { role: httpd ,tags: [ 'httpd', 'web' ] }
    - { role: mysql ,tags: [ 'mysql', 'db' ] }
    - { role: marridb ,tags: [ 'mysql', 'db' ] }
    - { role: php }

实验: 创建角色memcached

memcacched 当做缓存用,会在内存中开启一块空间充当缓存
cat /etc/sysconfig/memcached 
    PORT="11211"
    USER="memcached"
    MAXCONN="1024"
    CACHESIZE="64"    # 缓存空间默认64M 
    OPTIONS=""


1> 创建对用目录
   cd /app/ansible
   mkdir roles/memcached/{tasks,templates} -pv
   
2> 拷贝memcached配置文件模板
   cp /etc/sysconfig/memcached  templates/memcached.j2
   vim templates/memcached.j2
   CACHESIZE="{{ansible_memtotal_mb//4}}"   #物理内存的1/4用做缓存
   
3> 创建对应yml文件,并做相应配置
   cd tasks/
   touch install.yml config.yml service.yml
   创建main.yml文件定义任务执行顺序
   vim main.yml
   - include: install.yml
   - include: config.yml
   - include: service.yml  
   
   vim install.yml
   - name: install 
     yum: name=memcached
     
   vim config.yml
   - name: config file
     template: src=memcached.j2 dets=/etc/sysconfig/memcached

   vim service.yml
   - name: service
     service: name=memcached state=started enabled=yes

4> 创建调用角色文件
   cd /app/ansible/roles/
   vim role_memcached.yml
    ---
    - hosts: appsrvs
    
      roles: 
        - role: memcached

5> 安装
   ansible-playbook  role_memcached.yml 
   memcached端口号11211

其它功能

委任（指定某一台机器做某一个task）
    delegate_to
    local_action (专指针对ansible命令执行的机器做的变更操作)
交互提示
    prompt
*暂停（java）
    wait_for
Debug
    debug: msg="This always executes."
Include
Template 多值合并
Template 动态变量配置

Ansible Roles

委任
    delegate_to
交互提示
    prompt
暂停
    wait_for
Debug
    debug: msg="This always executes."
Include
Template 多值合并
Template 动态变量配置

实验: 实现二进制安装mysql的卸载

yaml

cat remove_mysql.yml 
---
# install mariadb server 
- hosts: appsrvs:!192.168.38.108
  remote_user: root

  tasks:
    - name: stop service 
      shell: /etc/init.d/mysqld stop
    - name: delete user 
      user: name=mysql state=absent remove=yes
    - name: delete
      file: path={{item}} state=absent
      with_items: 
        - /usr/local/mysql
        - /usr/local/mariadb-10.2.27-linux-x86_64
        - /etc/init.d/mysqld
        - /etc/profile.d/mysql.sh
        - /etc/my.cnf
        - /data/mysql

ansible-playbook  remove_mysql.yml

替换为阿里源

Sat, 13 Dec 2025 02:14:42 GMT

docker

FROM alpine:lts

# 替换为阿里源
RUN sed -i 's/dl-cdn.alpinelinux.org/mirrors.aliyun.com/g' /etc/apk/repositories

# 设置时区为上海
RUN apk add tzdata && cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime \
    && echo "Asia/Shanghai" > /etc/timezone \
    && apk del tzdata

还有一种方法是映射宿主机的/etc/localtime文件到容器内，权限设置为只读，当然宿主机的时区要配置正确

K8s的写法是

yaml

volumes:
  - name: host-time
    hostPath:
      path: /etc/localtime
      type: ''
containers:
  - name: frontend
    image: $IMAGE_NAME:$BUILD_NUMBER
    ports:
      - name: tcp-80
        containerPort: 80
        protocol: TCP
    resources: {}
    volumeMounts:
      - name: host-time
        readOnly: true
        mountPath: /etc/localtime

phpenv versions

Sat, 13 Dec 2025 02:14:42 GMT

通过一个实际例子说下使用Docker的好处

最近有一个新的后台API项目需要运行在PHP5.3环境中，软件行业有个特点，版本更新快，工具层出不穷。PHP5.3至少是5年前的版本了。 PHP官方早已不维护，虽然提供源码，但是安装配置也很麻烦，又不想污染目前机器上PHP7环境。

所以想到了Docker，通过这篇文章我很快的就利用Docker解决了我的问题，我直接利用别人提供好的Docker镜像，可以快速实现PHP版本切换

我觉得Docker适合以下情况：

运行特定的开发环境，比如要运行两个项目。一个要求PHP5.6，一个PHP7.0。不想来回切换。或者同时运行多个Node版本等等。
喜欢尝鲜，折腾，docker有很强的隔离性。在docker里搞坏也不会破坏本地，用到的时候docker run 启动镜像和容器，不想用了docker rm [容器名]删掉即可。

以ThinkPHP3.2框架为例，通过docker跑起来，可以按如下步骤：

安装 Docker，略记得一定要切换为国内源，不然速度巨慢，还容易报错，推荐免费的 https://www.daocloud.io/mirror#accelerator-doc 或者搜索阿里docker镜像源。
下载镜像 docker pull eriksencosta/php-dev
项目目录是已经存在的路径是 D:/projects/live-ranking-api
运行容器其中参数：

-p 端口映射
-v 或者 --volume，挂载目录，冒号前是宿主机目录，后面的是容器内目录
-t 或者 --tty 分配一个伪终端
-i 或者 --interactive, 就是表示已交互方式运行容器，啥是交互方式？就是你输入命令，就返回命令的结果，
-d 或者 --detach, 在容器在后台运行，并返回容器ID，这样可以不用再新开一个窗口运行成功后会执行 /bin/bash 就是进去终端

docker run 后面可以带很多参数,见官网

完整的命令如下： docker run -t -i -p 8088:80 -v D:/projects/live-ranking-api:/var/www -d "eriksencosta/php-dev:latest" /bin/bash

打开浏览器输入 localhost:8088 正常的话项目已经成功跑起来了
切换PHP版本，在容器内的终端内输入 phpenv命令 列出当前可选择的PHP版本

bash

# phpenv versions
  5.3
  5.3.29
  5.4
  5.4.35
  5.5
  5.5.19
  5.6
* 5.6.3 (set by /opt/phpenv/version)

执行 phpenv global 5.4

bash

# phpenv global 5.4
# php -v
PHP 5.4.35 (cli) (built: Dec 14 2014 00:35:12)
Copyright (c) 1997-2014 The PHP Group
Zend Engine v2.4.0, Copyright (c) 1998-2014 Zend Technologies
    with Zend OPcache v7.0.3, Copyright (c) 1999-2014, by Zend Technologies
    with Xdebug v2.2.6, Copyright (c) 2002-2014, by Derick Rethans

启动 nginx

bash

# webserver start
Starting PHP-FPM (PHP version 5.3) server.
Starting Nginx server.
Done.

参考：

为什么需要docker图形化管理平台？

Sat, 13 Dec 2025 02:14:42 GMT

目前我最经常使用的 Kubersphere 个人觉得是最适合国内使用的图形化k8s管理平台

2019-11-6 更新 lazydocker 终端UI的docker和docker-compose

2019-3-8 更新 dockstation Docker的GUI管理工具

为什么需要docker图形化管理平台？

命令行虽然效率高，但太专业，不够直观，而且多主机管理不方便。图形化管理系统还可以和用户角色管理等关联起来。不用太多的专业知识也能很快上手。

都有哪些开源免费的docker图形化管理平台？

截至当前(2018年) Rancher 和 portainer 比较火，star数量都将近1w。还有个shipyard，但是作者已经停止维护，并推荐使用前面两款。

Portainer 比 Rancher 要轻量，如果刚接触 Docker，建议先使用这个。如果要图形化管理 Kubernetes 就用 Rancher。

Portainer - 轻量的 Docker UI管理系统

先看下 Portainer ，以 Windows 为例，Portainer 可以运行在容器中，也可以下载编译后的包。比如这里我下载的是 portainer-1.19.2-windows-amd64.tar.gz

下载最新的发行版本 https://github.com/portainer/portainer/releases 解压到新建的portainer目录中，这个目录底下再新建保存数据的目录 portainer_data 打开命令行执行下面的命令，然后浏览器就可以访问了 ./portainer.exe -p :9000 --template-file templates.json --data ./portainer_data/

具体细节参考： https://portainer.readthedocs.io/en/latest/deployment.html#quick-start 关于在Windows运行的教程 http://blog.airdesk.com/2017/10/windows-containers-portainer-gui.html

Rancher - 针对 Kubernetes 企业级管理系统

文档： Rancher 。

下面放几张图：

装好后，打开先让设置管理员密码：

然后让添加一个集群，先修改语言为中文。

填写信息，呃，好像是配置Kubernates。还没有研究到这里先到这里吧。有空再研究。

cadvisor - 容器监控工具

有时候需要监控每个容器的运行情况。 google出品了cAdvisor 运行后，可打开web界面查看所有的容器，镜像。

点击某容器，可查看具体的CPU，内存，网络，文件系统的运行情况

cAdvisor提供的页面非常简洁。页面上的数据可以通过他暴露的API直接获取，可以把 cAdvisor 定位为一个监控数据收集器，收集和导出数据是它的强项，而非展示数据。所以可以结合其他工具一块使用。

lazydocker - 终端用户界面

lazydocker，一个简单的 docker 和 docker-compose 终端用户界面，用更懒惰的方式来管理所有的 docker。

其界面采用 gocui 开发。

build stage

Sat, 13 Dec 2025 02:14:42 GMT

从Docker版本17.05.0-ce开始，就支持了一种新的构建镜像的方法，叫做：多阶段构建(Multi-stage builds)，旨在解决Docker构建应用容器中的一些痛点。在日常构建容器的场景中，经常会遇到在同一个容器中进行源码的获取，编译和生成，最终才构建为镜像。这样做的劣势在于：

不得不在容器中安装构建程序所必须的运行时环境
不得不在同一个容器中，获取程序的源码和构建所需的一些生态工具
构建出的镜像甚至包含了程序源码和一些不必要的文件，导致容器镜像尺寸偏大

当然，还有一种稍微优雅的方式，就是我们事先在外部将项目及其依赖库编译测试打包好后，再将其拷贝到构建目录中，这种虽然可以很好地规避第一种方式存在的风险点，但是也需要考虑不同镜像运行时，对于程序运行兼容性所带来的差异。

其实，这些痛点，Docker也想到了，官方提供了简便的多阶段构建 (multi-stage build) 方案。所谓多阶段构建，也即将构建过程分为多个阶段，在同一个Dockerfile中，通过不同的阶段来构建和生成所需要的应用文件，最终将这些应用文件添加到一个release的镜像中。这样做能完全规避上面所遇到的一系列问题。实现多阶段构建，主要依赖于新提供的关键字：from和as。

下面举个前端的例子：

bash

# build stage
FROM node:9.11.1-alpine as build-stage
WORKDIR /app
COPY package*.json ./
RUN npm install
COPY . .
RUN npm run build

# production stage
FROM nginx:1.13.12-alpine as production-stage
COPY --from=build-stage /app/dist /usr/share/nginx/html
EXPOSE 80
CMD ["nginx", "-g", "daemon off;"]

第一阶段：拷贝源文件到镜像中，生成用于生产环境需要的静态资源文件第二阶段：启动一个nginx容器，托管第一阶段的静态文件

bash

# 编译阶段
FROM golang:1.10.3

COPY server.go /build/

WORKDIR /build

RUN CGO_ENABLED=0 GOOS=linux GOARCH=amd64 GOARM=6 go build -ldflags '-w -s' -o server

# 运行阶段
FROM scratch

# 从编译阶段的中拷贝编译结果到当前镜像中
COPY --from=0 /build/server /

ENTRYPOINT ["/server"]

这个 Dockerfile 的玄妙之处就在于 COPY 指令的 --from=0 参数，从前边的阶段中拷贝文件到当前阶段中，多个FROM语句时，0代表第一个阶段。除了使用数字，我们还可以给阶段命名，比如：

bash

# 编译阶段 命名为 builder
FROM golang:1.10.3 as builder

# ... 省略

# 运行阶段
FROM scratch

# 从编译阶段的中拷贝编译结果到当前镜像中
COPY --from=builder /build/server /

更为强大的是，COPY --from 不但可以从前置阶段中拷贝，还可以直接从一个已经存在的镜像中拷贝。比如，

bash

FROM ubuntu:16.04

COPY --from=quay.io/coreos/etcd:v3.3.9 /usr/local/bin/etcd /usr/local/bin/

我们直接将etcd镜像中的程序拷贝到了我们的镜像中，这样，在生成我们的程序镜像时，就不需要源码编译etcd了，直接将官方编译好的程序文件拿过来就行了。

有些程序要么没有apt源，要么apt源中的版本太老，要么干脆只提供源码需要自己编译，使用这些程序时，我们可以方便地使用已经存在的Docker镜像作为我们的基础镜像。但是我们的软件有时候可能需要依赖多个这种文件，我们并不能同时将 nginx 和 etcd 的镜像同时作为我们的基础镜像（不支持多根），这种情况下，使用 COPY --from 就非常方便实用了。

多阶段构建的Dockerfile看起来像是把两个或者更多的Dockerfile合并在了一起，这也即多阶段的意思。 as关键字用来为构建阶段赋予一个别名，这样，在另外一个构建阶段中，可以通过from关键字来引用和使用对应关键字阶段的构建输出，并打包到容器中。

甚至，我们还可以使用更多的构建阶段来构建不同的应用，最终将这些构建产出的应用，合并到一个最终需要发布的镜像中。我们可以看一个更复杂一点的栗子：

bash

from debian as build-essential
arg APT_MIRROR
run apt-get update
run apt-get install -y make gcc
workdir /src

from build-essential as foo
copy src1 .
run make

from build-essential as bar
copy src2 .
run make

from alpine
copy --from=foo bin1 .
copy --from=bar bin2 .
cmd ...

再来一个Laravel项目的多阶段构建( 自己加的内容) 第一阶段：使用compose安装PHP依赖第二阶段：安装node，并安装前端依赖然后生成编译后的文件第三阶段：拷贝PHP依赖及前端build后的文件到项目运行目录

bash

#
# PHP Dependencies
#
FROM composer:1.7 as vendor

COPY database/ database/

COPY composer.json composer.json
COPY composer.lock composer.lock

RUN composer install \
    --ignore-platform-reqs \
    --no-interaction \
    --no-plugins \
    --no-scripts \
    --prefer-dist

#
# Frontend
#
FROM node:8.11 as frontend

RUN mkdir -p /app/public

COPY package.json webpack.mix.js yarn.lock /app/
COPY resources/assets/ /app/resources/assets/

WORKDIR /app

RUN yarn install && yarn production

#
# Application
#
FROM php:7.2-apache-stretch

COPY . /var/www/html
COPY --from=vendor /app/vendor/ /var/www/html/vendor/
COPY --from=frontend /app/public/js/ /var/www/html/public/js/
COPY --from=frontend /app/public/css/ /var/www/html/public/css/
COPY --from=frontend /app/mix-manifest.json /var/www/html/mix-manifest.json

多阶段构建的好处不言而喻，既可以很方便地将多个彼此依赖的项目通过一个Dockerfile就可轻松构建出期望的容器镜像，并且不用担心镜像太大、源码泄露等风险。不得不说，这是一个非常不错的改进。

参考：

By default we only accept connections from localhost

Sat, 13 Dec 2025 02:14:42 GMT

Docker 的一大好处是在本地可以很方便快速的搭建负载均衡，主从同步等需要多主机的环境。可以说是极大方便了运维成本和难度。本节在本地搭建 mysql 的一主一从的集群环境。

关于主从同步的流程图，放张网上找的流程图

以mysql5.7为例

创建 mysql-master-slave 目录，比如完整路径是 D:/docker/mysql-master-slave 目录结构如下：

yaml

-- master
  -- data
   mysqld.cnf
-- slave
  -- data
      mysqld.cnf

其中master目录底下的 mysqld.cnf 配置文件内容为

ini

[mysqld]
pid-file	= /var/run/mysqld/mysqld.pid
socket		= /var/run/mysqld/mysqld.sock
datadir		= /var/lib/mysql

#log-error	= /var/log/mysql/error.log

# By default we only accept connections from localhost
#bind-address	= 127.0.0.1

# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0

# 以下是新增内容
# 标识不同的数据库服务器，而且唯一
server-id=1
# 启用二进制日志
log-bin=mysql-bin
log-slave-updates=1
innodb_flush_log_at_trx_commit = 2
innodb_flush_method = O_DIRECT
skip-host-cache
skip-name-resolve

slave 目录底下的 mysqld.cnf 内容为

ini

[mysqld]
pid-file	        = /var/run/mysqld/mysqld.pid
socket		= /var/run/mysqld/mysqld.sock
datadir		= /var/lib/mysql
#log-error	= /var/log/mysql/error.log
# By default we only accept connections from localhost
#bind-address	= 127.0.0.1
# Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0

# 以下是新增内容
server-id=2
log-bin=mysql-bin
log-slave-updates=1
# 多主的话需要注意这个配置，防止自增序列冲突。
auto_increment_increment=2
auto_increment_offset=2
read-only=1
slave-skip-errors = 1062
skip-host-cache
skip-name-resolve

基于官方mysql镜像，运行两个容器并指定一些参数启动名称为mysql_master的容器作为master数据库

bash

docker run --name mysql_master -d -p 3307:3306 -e MYSQL_ROOT_PASSWORD=123456 \
    -v D:/docker/mysql-master-slave/master/data:/var/lib/mysql \
    -v D:/docker/mysql-master-slave/master/mysqld.cnf:/etc/mysql/mysql.conf.d/mysqld.cnf  mysql:5.7
    
docker run --name mysql_slave -d -p 3308:3306 -e MYSQL_ROOT_PASSWORD=123456 \
  -v D:/docker/mysql-master-slave/slave/data:/var/lib/mysql \
  -v D:/docker/mysql-master-slave/slave/mysqld.cnf:/etc/mysql/mysql.conf.d/mysqld.cnf  mysql:5.7

这个时候宿主机的 Navicat 应该可以连上容器里的两个数据库了。

配置主从同步，新开终端进入容器 docker exec -it mysql_master bash mysql -u root -p 创建一个同步数据权限的用户 GRANT REPLICATION SLAVE ON *.* to 'backup'@'%' identified by '123456'; 查看状态，记住File、Position的值，在 Slave 中将用到 show master status;

进入slave容器 docker exec -it mysql_slave bash mysql -u root -p 设置主库链接 change master to master_host='172.17.0.2',master_user='backup',master_password='123456',master_log_file='mysql-bin.000001',master_log_pos=0,master_port=3306; 启动从库同步 start slave 查看状态，如果 Slave_SQL_Running_State 是 Slave has read all relay log; waiting for more updates 表示正常运行。 show slave status \G

测试同步，在master上新建一个数据库 docker exec mysql_master mysql -uroot -p123456 -e "CREATE DATABASE test" docker exec mysql_slave mysql -uroot -p123456 -e "SHOW DATABASES"

总结：

mysqld.cnf 文件的由来? 答：就是从容器内的 /etc/mysql/mysql.conf.d/mysqld.cnf 拷贝出来的
主从同步的简单原理？答： MySQL的主从复制是一个异步的复制过程，数据库从一个Master复制到Slave数据库，在Master与Slave之间实现整个主从复制的过程是由三个线程参与完成的，其中有两个线程(SQL线程和IO线程)在Slave端，另一个线程(IO线程)在Master端。 master 数据变化时会产生bin log日志，slave上的线程拉去bin log，然后在slave上重新执行日志。这样就保证了数据一致性。
show slave status 中的Slave_IO_Running和Slave_SQL_Running的含义？答：Slave 上会同时有两个线程在工作， I/O 线程从 Master 得到数据（Binary Log 文件），放到被称为 Relay Log 文件中进行记录。另一方面，SQL 线程则将 Relay Log 读取并执行。为什么要有两个线程？这是为了降低同步的延迟。因为 I/O 线程和 SQL 线程都是相对很耗时的操作。
从服务器同步失败？答：看错误日志 tail /var/log/mysql/error.log 重新执行同步 stop slave; change master to master_log_file='mysql-bin.000100,master_log_pos=123' 关于 file 和 pos，需在master上执行show master status获得。或者使用 mysqlbinlog 命令分析。
如何添加多个从节点? 和添加第一个从节点类似，先导出master的数据，复制第一个slave配置文件，唯一要改变的是server-id，不能和其他的重复。之后启动新的容器，进到容器内执行change master to ...。还需要注意当前master没有写入等操作，最好先锁表，同步设置好后在解锁。参考

问题：

如何添加slave节点服务器，如何主主备份更多细节还得啃官方文档
使用 docker compose 配置 mysql 主从 http://tarunlalwani.com/post/mysql-master-slave-using-docker/

参考：

背景

Sat, 13 Dec 2025 02:14:42 GMT

背景

MySQL本身是开源的，有些公司或社区基于MySQL发布了新的分支，如有名的MariaDB。

在介绍 Percona 之前，首要要介绍的是XtraDB存储引擎，在MYSQL中接触比较多的是MyISAM 和 InnoDB这两个存储引擎。

MySQL 4 和 5 使用默认的 MyISAM 存储引擎安装每个表。从5.5开始，MySQL已将默认存储引擎从 MyISAM 更改为 InnoDB。MyISAM 没有提供事务支持，而 InnoDB 提供了事务支持。与 MyISAM 相比，InnoDB 提供了许多细微的性能改进，并且在处理潜在的数据丢失时提供了更高的可靠性和安全性。

Percona Server由领先的MySQL咨询公司Percona发布。Percona Server是一款独立的数据库产品，其可以完全与MySQL兼容，可以在不更改代码的情况了下将存储引擎更换成XtraDB 。

Percona XtraDB Cluster 完全兼容MySQL。

常见MySQL集群方案

Percona XtraDB Cluster优缺点

优点： 1.当执行一个查询时，在本地节点上执行。因为所有数据都在本地，无需远程访问。 2.无需集中管理。可以在任何时间点失去任何节点，但是集群将照常工作。 3.良好的读负载扩展，任意节点都可以查询。

缺点： 1.加入新节点，开销大。需要复制完整的数据。 2.不能有效的解决写缩放问题，所有的写操作都将发生在所有节点上。 3.有多少个节点就有多少重复的数据。

基于Docker的实现流程

拉镜像 docker pull percona/percona-xtradb-cluster:5.7
镜像名字有点长，起个短点的 docker tag percona/percona-xtradb-cluster:5.7 pxc
出于安全考虑，针对PXC集群实例创建内部网络创建的时候通过参数指定IP段和子网掩码，Docker默认使用的IP 172.17.0.1，我们换个别的。 docker network create --subnet=172.18.0.0/24 pxc-network
创建第一个节点 docker run -d -p 33010:3306 -e MYSQL_ROOT_PASSWORD=root -e CLUSTER_NAME=pxc_cluster --name=pxc_node1 --net=pxc-network --ip=172.18.0.2 pxc 执行 docker logs pxc_node1 查看执行状态，如果看到 mysqld: ready for connections. 就可以使用navicat等工具测试连接。
创建第二个数据库节点，并加入到第一个集群中，注意多了 CLUSTER_JOIN 参数 docker run -d -p 33011:3306 -e MYSQL_ROOT_PASSWORD=root -e CLUSTER_NAME=pxc_cluster -e CLUSTER_JOIN=pxc_node1 --name=pxc_node2 --net=pxc-network --ip=172.18.0.3 pxc
创建第三个数据库节点，并加入到第一个集群中，注意多了 CLUSTER_JOIN 参数 docker run -d -p 33012:3306 -e MYSQL_ROOT_PASSWORD=root -e CLUSTER_NAME=pxc_cluster -e CLUSTER_JOIN=pxc_node1 --name=pxc_node3 --net=pxc-network --ip=172.18.0.4 pxc
接下来可以创建第N个节点，注意参数如容器名称 --name 和映射的端口别冲突；
测试：本地连接这三个节点，在其中一个创建demo数据，其他节点都自动同步数据过去了

注意

启动第一个节点后记得使用docker logs查看启动状态，然后使用navicat等工具测试连接，等第一个mysql运行成功后再运行第二个容器。否则第二个起不来，需要重新启动容器。
如果停掉某一节点 docker stop pxc_node1 再启动时 docker start pxc_node1 可能会发现连接不上了。这时候可以删除容器，重新运行，命令类似 docker run -d -p 33010:3306 -e MYSQL_ROOT_PASSWORD=root -e CLUSTER_NAME=pxc_cluster -e CLUSTER_JOIN=pxc_node2 --name=pxc_node1 --net=pxc-network --172.18.0.2 pxc

参考

实现流程：

Sat, 13 Dec 2025 02:14:42 GMT

在上节中我们创建了 mysql 集群。实际工作中，我们不希望让某一数据库节点处理所有的请求，这样的话单个负载高，性能差。

在这里我们使用haproxy作为负载均衡的中间件，类似的还有LVS，但是好像不支持虚拟机，在docker中用不了。

实现流程：

下载镜像 docker pull haproxy
宿主机创建 haproxy 的配置文件，比如路径是 D:\Docker\haproxy\haproxy.cfg
最重要的就是配置文件了。这里内容如下：

ini

global
        daemon
        # nbproc 1
        # pidfile /var/run/haproxy.pid
        # 工作目录
        chroot /usr/local/etc/haproxy

defaults
        log 127.0.0.1 local0 err #[err warning info debug]
        mode http                #默认的模式mode { tcp|http|health }，tcp是4层，http是7层，health只会返回OK
        retries 2                #两次连接失败就认为是服务器不可用，也可以通过后面设置
        option redispatch        #当serverId对应的服务器挂掉后，强制定向到其他健康的服务器
        option abortonclose      #当服务器负载很高的时候，自动结束掉当前队列处理比较久的链接
        option dontlognull       #日志中不记录负载均衡的心跳检测记录
        maxconn 4096             #默认的最大连接数
        timeout connect 5000ms   #连接超时
        timeout client 30000ms   #客户端超时
        timeout server 30000ms   #服务器超时
        #timeout check 2000      #=心跳检测超时

######## 监控界面配置 #################
listen admin_status
        # 监控界面访问信息
        bind 0.0.0.0:8888
        mode http
        # URI相对地址
        stats uri /dbs
        # 统计报告格式
        stats realm Global\ statistics
        # 登录账户信息
        stats auth admin:123456
########frontend配置##############

######## mysql负载均衡配置 ###############
listen proxy-mysql
        bind 0.0.0.0:3306
        mode tcp
        # 负载均衡算法
        # static-rr 权重, leastconn 最少连接, source 请求IP, 轮询 roundrobin
        balance roundrobin
        # 日志格式
        option tcplog
        # 在 mysql 创建一个没有权限的haproxy用户，密码为空。 haproxy用户
        # create user 'haproxy'@'%' identified by ''; FLUSH PRIVILEGES;
        option mysql-check user haproxy
         # 这里是容器中的IP地址，由于配置的是轮询roundrobin，weight 权重其实没有生效
        server MYSQL_1 172.18.0.2:3306 check weight 1 maxconn 2000
        server MYSQL_2 172.18.0.3:3306 check weight 1 maxconn 2000
        server MYSQL_3 172.18.0.4:3306 check weight 1 maxconn 2000
        # 使用keepalive检测死链
        # option tcpka
#########################################

启动 haproxy 的容器，镜像名称为 h1，网络名称使用上节中创建的 pxc-network，就是和 mysql 集群处于同一网络。 docker run -it -d -p 4001:8888 -p 4002:3306 -v D:/Docker/haproxy:/usr/local/etc/haproxy --name h1 --net=pxc-network
进去容器，并让 haproxy 加载配置 docker exec -it h1 bash haproxy -f /usr/local/etc/haproxy/
宿主机打开 http://localhost:4001/dbs 这是haproxy 提供的图形界面

可以看到每个mysql节点运行状态是绿色，说明正常。 7. 测试，停掉一个数据库节点 docker stop pxc_node1 ，发现有一个变红了。

项目中可以使用配置的 4002 来连接数据库，这样请求会被分发到各个子节点。

总结：

数据库的负载均衡配置还是比较简单的，关键是负载均衡算法，如果每个数据库节点配置都一样，可以使用轮询算法，如果不一样，可以使用权重算法，让配置高的多接收请求。
官方的教程

总结：

Sat, 13 Dec 2025 02:14:42 GMT

PHPStorm整合一些了Docker相关的功能，并有官方的Docker镜像

下面介绍怎么通过PHPStorm创建并运行一个docker容器项目并启用xdebug，以Windows系统为例

运行 Docker for Windows，Docker运行成功后桌面右下角有图标，右键选择Settings 勾选 "Expose daemon on tcp://localhost:2375" 就是暴露守护进程。

比如有一个空项目叫 Docker-compose-demo，用PHPStorm打开新建 docker-compose.yml文件
内容如下：

yaml

version: '2'
services:
  webserver:
    image: phpstorm/php-71-apache-xdebug-26
    ports:
      - "6080:80"
    volumes:
      - ./:/var/www/html
    environment:
      #change the line below with your IP address
      XDEBUG_CONFIG: remote_host=host.docker.internal

host.docker.internal 指运行IDE的本机IP 4. PHPStorm 中菜单项 'Run - Edit Configurations' 配置Docker信息。因为之前我们开放了docker的守护进行，可以通过TCP协议，地址localhost:2372进行连接。PHPStorm连接上会显示 success

鼠标右键选择 Run 'docker-compose.yml'，通过PHPStorm下载镜像并运行容器

可以看到本机安装过的Docker的容器和镜像。当前正在执行 docker-compose.yml

运行成功了，可以直观的看到容器的相关信息

项目根目录创建index.php，浏览器打开 localhost:6080 查看效果
因为已经配置了xdebug，直接就可以用。具体 chrome浏览器安装 xdebug helper 新建index.php 内容：

$arr = ['jack', 'smith', 'www'];
foreach ($arr as $item) {
   # 在下面的 echo 处打断点
    echo $item;
}

如图，每点一次步进就显示当前运行时的相关变量信息。非常方便。

总结：

使用docker大大方便了咱们的环境搭建流程。

这篇文章我是看了官方的视频后写的。

还有配置文件只配置了apache服务器，关于mysql等官方镜像中其实也提供了。请自行修改docker-compose.yml。

PHPStorm官方镜像： https://github.com/JetBrains/phpstorm-docker-images/blob/master/docker-compose.yml

Sat, 13 Dec 2025 02:14:42 GMT

COPY 和 ADD 命令具有相同的特点：只复制目录中的内容而不包含目录自身。比如 backend 目录的结构如下：

yaml

 --- backend
     -- model
     -- controller

如果执行

bash

WORKDIR /app
COPY backend .

容器内app底下会是model和controller目录，并不是backend目录。如果要拷贝整个目录，应该： COPY backend ./backend

如果修改了 Dockerfile，记得要重新执行build，即生成新的镜像。这样启动后才能看到效果。
打包node项目中的node_modules问题。某node项目结构:

src
node_modules
package.json
package-lock.json

dockerfile部分代码

FROM node:8.12-alpine
RUN mkdir -p /app
WORKDIR /app
COPY package.json .
COPY package-lock.json .
RUN npm install
...

我们在容器内生成了项目所依赖的node_modules文件。这是docker的build阶段。之后在run启动阶段时，在mouted共享目录时要特别小心，如果挂载整个项目，容器内的node_modules会被项目中的覆盖。最好把需要挂载的文件单独放到一个目录中。

关于项目目录是挂载好，还是COPY ADD好，stackoverflow上有人也问过

COPY/ADD 文件是镜像的一部分，在docker构建阶段执行。比较适合项目的生产环境，比如自动化。对于成熟稳定的项目，把编译后的可以直接运行的代码打包进镜像内也利于分发。
volumn 是在docker运行阶段，本地文件变化能方便的反应到容器中，比较适合项目的开发阶段。要根据实际情况，挂载可以节省空间，便于修改。如果是想文件COPY到容器，每次修改文件都需要重新制作镜像。

关于 docker-compose，对于镜像的版本，数据库密码等不建议直接写死到 docker-compose.yml 中，可以新建.env文件。 docker-compose部分

yaml

  mysql:
      build: ./docker-build/mysql
      ports:
        - "33060:3306"
      volumes:
        - ./docker-build/mysql/data:/var/lib/mysql
      environment:
        MYSQL_ROOT_PASSWORD: ${DOCKER_MYSQL_PASSPORD-123456}

.env文件 DOCKER_MYSQL_PASSPORD=mypassord 比如下面的${DOCKER_MYSQL_PASSPORD-123456}表示优先去.env文件找定义的key值，如果没有则使用默认值，即123456。 docker-compose.yml 受版本控制，.env不受。更多细节参考

在 Laravel 项目中，如果数据库跑在容器里，在宿主机直接执行php aritsan是不行的，

需要进到容器里执行，或者在宿主机执行docker-compose exec php artisan或者是docker exec -it php artisan

如果php项目用的nginx的php-fpm容器，想重启php-fpm，容器内使用kill -USR2 1，容器外执行docker exec -it kill -USR2 1\
docker-compose down要慎用，他会销毁所有容器和网络等。如果你之前在容器里修改过文件，都会没有。当然docker也不推荐直接在容器动手脚，建议写个shell脚本，启动之后在容器内执行。
还是 mysql 数据库问题，如果容器启动了 mysql，之后通过配置修改了密码，可能会造成重新连接后死活显示"Access denied"。这是因为如果建立了共享卷volume，里面存的还是老的user信息，需要docker-compose rm -v 清除卷然后重连。
删除日志 find /var/lib/docker/containers/ -type f -name "*.log" -delete
删除所有停止的容器 docker rm $(docker ps -a -q)
Docker 提供了方便的 docker system prune 命令来删除那些已停止的容器、dangling 镜像、未被容器引用的 network 和构建过程中的 cache. 安全起见，这个命令默认不会删除那些未被任何容器引用的数据卷，如果需要同时删除这些数据卷，你需要显式的指定 --volumns 参数。比如你可能想要执行下面的命令： docker system prune --all --force --volumns

注意，使用 --all 参数后会删除所有未被引用的镜像而不仅仅是 dangling 镜像。

何为 dangling images，其实可以简单的理解为未被任何镜像引用的镜像。比如在你重新构建了镜像后，那些之前构建的且不再被引用的镜像层就变成了 dangling images

我们还可在不同在子命令下执行 prune，这样删除的就是某类资源：

bash

docker container prune # 删除所有退出状态的容器
docker volume prune # 删除未被使用的数据卷
docker image prune # 删除 dangling 或所有未被使用的镜像

docker diff 容器名或ID，可以查看容器发生的文件系统的变化信息如下图，我在容器里新建了个demo.txt文件，在docker diff中可以查看出来 A 添加， C 修改， D 删除

参考：http://blog.51cto.com/13954634/2294107

Sat, 13 Dec 2025 02:14:42 GMT

先说总结：

docker save保存的是镜像（image），docker export保存的是容器（container）；
docker load用来载入镜像包，docker import用来载入容器，但两者都会恢复为镜像；
docker load不能对载入的镜像重命名，而docker import可以为镜像指定新名称。

比如我本机上有一个 finleyma/express的镜像，容器ID为4a655b443069 使用如下命令分别导出镜像和容器 docker save -o image-express-save.tar finleyma/express docker export -o container-express-export.tar 4a655b443069

发现如下特点：

镜像压缩包比容器要大。
目录结构不太一样

容器压缩包是很典型的Linux目录结构，还找到当初build时被ADD进的源码文件

镜像压缩包其实就是分层的文件系统。Docker镜像就是由这样一层层的文件叠加起来。打开压缩包内的 repositories，内容为 {"finleyma/express":{"latest":"dda6ce6f2c43f673353e2ce232b31d11ff15b444e338a0ef8f34b6ef74093d6c"}} 既这个镜像的名称，tag是latest，id为dda6ce6f2c43f673353e2ce232b31d11ff15b444e338a0ef8f34b6ef74093d6c 而且tar内有相同ID的目录。

json文件的内容如下：里面记录着这一层容器文件的元信息，通过parent，还能知道依赖的上一层的文件系统是什么。

json

{
	"id": "dda6ce6f2c43f673353e2ce232b31d11ff15b444e338a0ef8f34b6ef74093d6c",
	"parent": "b75acde96878455ce36208008bb1143d4ea17723257c991f8bfb33ad9e27251d",
	"created": "2018-09-19T15:41:54.6130547Z",
	"container": "3cd78865317bce73179abc7d21fcbe860a96d14fc980c01566fa2c9412b17d7d",
	"container_config": {
		"Hostname": "3cd78865317b",
		"Domainname": "",
		"User": "",
		"AttachStdin": false,
		"AttachStdout": false,
		"AttachStderr": false,
		"ExposedPorts": {
			"8081/tcp": {}
		},
		"Tty": false,
		"OpenStdin": false,
		"StdinOnce": false,
		"Env": ["PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin", "NODE_VERSION=8.9.4", "YARN_VERSION=1.3.2"],
		"Cmd": ["/bin/sh", "-c", "#(nop) ", "CMD [\"npm\" \"start\"]"],
		"ArgsEscaped": true,
		"Image": "sha256:91f850e6adbd56df68088dffe63c56e6f48fc24f763ff9d22c739742be71212a",
		"Volumes": null,
		"WorkingDir": "/usr/src/app",
		"Entrypoint": null,
		"OnBuild": [],
		"Labels": {}
	},
	"docker_version": "18.06.1-ce",
	"config": {
		"Hostname": "",
		"Domainname": "",
		"User": "",
		"AttachStdin": false,
		"AttachStdout": false,
		"AttachStderr": false,
		"ExposedPorts": {
			"8081/tcp": {}
		},
		"Tty": false,
		"OpenStdin": false,
		"StdinOnce": false,
		"Env": ["PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin", "NODE_VERSION=8.9.4", "YARN_VERSION=1.3.2"],
		"Cmd": ["npm", "start"],
		"ArgsEscaped": true,
		"Image": "sha256:91f850e6adbd56df68088dffe63c56e6f48fc24f763ff9d22c739742be71212a",
		"Volumes": null,
		"WorkingDir": "/usr/src/app",
		"Entrypoint": null,
		"OnBuild": [],
		"Labels": null
	},
	"architecture": "amd64",
	"os": "linux"
}

打开lay.tar, 对于的原来就是当初dockerfile中的ADD . /app/

那 node_modules 跑哪了，你很快就能猜测到，肯定在上一层文件中。事实确实是这样的。ADD . /app/ 之前对于的命令是 RUN npm install

所以写dockerfile时，一行命令对于一层文件系统，要充分利用这样机制，层的数量尽可能少，只安装必要的依赖包。

参考：

Sat, 13 Dec 2025 02:14:42 GMT

这篇文章和 Docker 无关，只是稍微感慨下

近几天打算用Docker跑一个需要PHP5.6的项目，然后发现Docker官方提供的PHP镜像中，只有PHP7.0以上的介绍。没有PHP5.5及PHP5.6的(tag还有，只不过主页中没有) 感到比较纳闷，官方github也移除了相关的代码。搜索发现原来是PHP官方团队已经不再维护5.6。也就是说，既然官方都不管了，Docker更不没有必要继续维护相关分支。然后去PHP官方公告查看从2019年1月1日起PHP5.6已经不再维护支持，就连PHP7.1都只进行安全支持。

这样可以倒逼企业进行系统版本更新换代。对开发人员绝对是好事，虽然企业主出于成本考虑不愿意进行升级。最后如果想查看之前5.6及5.5的Dockerfile细节，可以查看这个PR。

开发阶段

Sat, 13 Dec 2025 02:14:42 GMT

适合Angular2以上项目

开发阶段

项目根目录添加Dockerfile文件

bash

# base image
FROM circleci/node:10.14-browsers
USER root
# set working directory
RUN mkdir -p /usr/src/app
WORKDIR /usr/src/app
# 如果觉得 npm install 慢可以使用淘宝源
RUN npm config set registry https://registry.npm.taobao.org

# install and cache app dependencies
COPY package*.json /usr/src/app/
RUN npm install
RUN npm install -g @angular/cli

# add `/usr/src/app/node_modules/.bin` to $PATH
ENV PATH /usr/src/app/node_modules/.bin:$PATH

# add app
COPY . /usr/src/app

# start app 根据实际情况修改配置
# CMD ng serve --host 0.0.0.0
CMD ng serve --port=4201 --proxy-config=proxy.conf.json --configuration=local --host 0.0.0.0

然后再添加.dockerignore文件，指定构建docker镜像时不希望发送给Docker daemon的文件。也就是不希望被打包进镜像的文件。防止镜像过大。

node_modules
.git

构建镜像 docker build -t angular-demo .
根据刚创建好的镜像启动一个容器

bash

docker run -it \
  -d # 加这个参数表示后台运行
  -v ${PWD}:/usr/src/app \
  -v /usr/src/app/node_modules \ #挂载依赖目录
  -p 4201:4201 \
  --rm \
  angular-demo

浏览器打开http://localhost:4201，然后修改本地的某个文件，如src/app/app.component.html 你会发现浏览器会自动刷新。
基础镜像circleci/node:10.14-browsers已经包含了chrome浏览器，我们可以直接跑unit test。先修改src/karma.conf.js添加ChromeHeadless配置。

javascript

// Karma configuration file, see link for more information
// https://karma-runner.github.io/1.0/config/configuration-file.html

module.exports = function (config) {
  config.set({
    basePath: '',
    frameworks: ['jasmine', '@angular-devkit/build-angular'],
    plugins: [
      require('karma-jasmine'),
      require('karma-chrome-launcher'),
      require('karma-jasmine-html-reporter'),
      require('karma-coverage-istanbul-reporter'),
      require('@angular-devkit/build-angular/plugins/karma'),
    ],
    client: {
      clearContext: false // leave Jasmine Spec Runner output visible in browser
    },
    files: [
      { pattern: '../node_modules/rxjs/**/*.js.map', included: false, watched: false },
      { pattern: '../node_modules/@angular/**/*.js.map', included: false, watched: false },
    ],
    browserConsoleLogOptions: {
      terminal: true,
      level: config.LOG_INFO
    },
    coverageIstanbulReporter: {
      dir: require('path').join(__dirname, '../coverage'),
      reports: ['html', 'lcovonly'],
      fixWebpackSourcePaths: true
    },
    reporters: ['progress', 'kjhtml'],
    port: 9876,
    colors: true,
    logLevel: config.LOG_INFO,
    autoWatch: true,
    browsers: ['Chrome'],
    // 加入下面的参数配置
    customLaunchers: {
     ChromeHeadless: {
       base: 'Chrome',
       flags: [
         '--headless',
         '--disable-gpu',
         '--no-sandbox',
         '--remote-debugging-port=9222'
         ]
       }
     },
    // if true, Karma will start and capture all configured browsers, run tests and then exit
    singleRun: true
  });
};

执行 docker exec -it angular-demo-container ng test --watch=false，注意替换下容器名
推荐使用docker-compose，好处是把运行参数记录在docker-compose.yml文件中。

yaml

version: '3.5'

services:
  node:
    container_name: angular-demo
    build:
      context: .
      dockerfile: Dockerfile
    volumes:
      - '.:/usr/src/app'
      - '/usr/src/app/node_modules'
    ports:
      - '4209:4201'

请留意下匿名卷/usr/src/app/node_modules。该目录是在docker build构建阶段创建的，在Run启动阶段需要手动挂载该目录。 9. docker-compose相关命令

bash

# build镜像并后台启动
docker-compose up -d --build
docker-compose run angular-demo ng test --watch=false
ng e2e
docker-compose stop

生产环境

创建一个生产环境用的Docker配置文件，Dockerfile-prod

bash

#########################
### build environment ###
#########################

# base image
FROM circleci/node:10.14-browsers  as builder

# set working directory
RUN mkdir /usr/src/app
WORKDIR /usr/src/app

# add `/usr/src/app/node_modules/.bin` to $PATH
ENV PATH /usr/src/app/node_modules/.bin:$PATH

# install and cache app dependencies
COPY package.json /usr/src/app/package.json
RUN npm install
RUN npm install -g @angular/cli

# add app
COPY . /usr/src/app

# run tests
RUN ng test --watch=false

# generate build
RUN npm run build

##################
### production ###
##################

# base image
FROM nginx:1.13.9-alpine

# copy artifact build from the 'build environment'
COPY --from=builder /usr/src/app/dist /usr/share/nginx/html

# expose port 80
EXPOSE 80

# run nginx
CMD ["nginx", "-g", "daemon off;"]

这里用到了Dockerfile支持的多阶段构建，首先利用临时Node镜像生成静态资源，然后将静态资源拷贝到nginx镜像中进行托管。 2. 打包镜像-f表示指定文件，docker build -f Dockerfile-prod -t angular-demo-prod . 3. 运行 docker run -it -p 80:80 --rm angular-demo-prod 4. 对应的docker-compose-prod.yml

yaml

version: '3.5'

services:

  angular-demo-prod:
    container_name: something-clever-prod
    build:
      context: .
      dockerfile: Dockerfile-prod
    ports:
      - '80:80'

docker-compose -f docker-compose-prod.yml up -d --build

参考

https://mherman.org/blog/dockerizing-an-angular-app/

从仓库拉镜像

Sat, 13 Dec 2025 02:14:42 GMT

接上篇

Docker容器虽然运行起来了。

但遇到了新的问题：

容器内安装的服务器是nginx，对于ThinkPHP项目，还需要一些额外的配置，简单的说在apache服务器下运行 http://localhost:8088/home/Index/index 能正常返回结果，而nginx下返回404，必须要写成 http://localhost:8088/index.php?m=home&c=Index&a=demo 所以我需要修改nginx配置文件，使其支持。
由于容器本身是无状态的，如果进到容器里修改完配置文件，关闭docker，下次在启动后还是原样，我需要保存修改。

下面是解决方法：

镜像为了精简并没有安装VIM编辑器，编辑文件不方便，要先安装 apt-get update; apt-get install vim 注意，如果执行 apt-get update 超时了，试试翻墙。或者替换为国内源。
vi /etc/nginx/sites-enabled/default 编辑并修改配置文件，记得最好先备份
修改完新开个窗口先执行 docker ps 查看正在运行的容器，复制 container id。然后 docker commit [OPTIONS] CONTAINER [REPOSITORY[:TAG]] 如 docker commit cb439fb2c714 finley/phpenv:tp3.2 commit 会基于对container的修改创建一个新的镜像具体用法请参见官方文档：commit

WARNING

经查，不推荐更改运行中的容器配置，容器本身是无状态的，当然也可以通过进入容器内部的方式进行更改: docker exec -it 这样的更改是无法持久化保存的，当容器重启后，更改就丢失了，正确的做法是将需要持久化保存的数据放在挂载的存储卷中，当配置需要改变时直接删除重建。

回顾：

# 从仓库拉镜像
docker pull eriksencosta/php-dev
# 基于上面的镜像加入了自己的修改并提交为自己的镜像，还打了tag
docker commit cb439fb2c714  finleyma/php-dev:tp3.2

问题：这个项目的环境是有了，但是是多人开发，我如何将我的配好的镜像分享给他人呢？请见下篇

设置工作目录，下面的RUN命令会在工作目录执行

Sat, 13 Dec 2025 02:14:42 GMT

在 Docker 学习系列17 镜像和容器的导入导出我讲过docker镜像是由一层层组成的比如如下dockerfile文件

bash

FROM node:10.8.0-alpine
MAINTAINER www.mafeifan.com
# 设置工作目录，下面的RUN命令会在工作目录执行
WORKDIR /app
# 先拷贝本地的 package.json 和 package-lock 到容器内
# 这样是利用docker的镜像分层机制
COPY package*.json ./
# 安装项目依赖包
# 生产环境可以运行 RUN npm install --only=production 只按照 package.json 中dependencies定义的模块
RUN npm install
# 将根目录下的文件都copy到container（运行此镜像的容器）文件系统的app文件夹下
ADD . /app/
# 暴露容器内的3000端口
EXPOSE 3000
# 容器启动时执行的命令，类似npm run start
CMD ["npm", "start"]

当我们执行docker build 生成镜像的时候，实际上每行命令产生的文件会存到一个目录中，即一层，Dockerfile 最佳实践也建议我们

镜像层数尽可能少

这里推荐一款工具 dive 可以方便的查看镜像层详情，评估镜像的质量，如浪费了多少空间

如果作为镜像审查之后，可以进行如下命令操作:

$: CI=true dive <image-id>
Fetching image... (this can take a while with large images)
Parsing image...
Analyzing image...
  efficiency: 95.0863 %
  wastedBytes: 671109 bytes (671 kB)
  userWastedPercent: 8.2274 %
Run CI Validations...
  Using default CI config
  PASS: highestUserWastedPercent
  SKIP: highestWastedBytes: rule disabled
  PASS: lowestEfficiency

从输出信息可以得到很多有用的信息，集成到CI过程也就非常容易了。 dive本身支持添加.dive-ci 配置文件作为项目的CI配置，具体配置规则见文档。

yaml

rules:
  # If the efficiency is measured below X%, mark as failed.
  # Expressed as a percentage between 0-1.
  lowestEfficiency: 0.95

  # If the amount of wasted space is at least X or larger than X, mark as failed.
  # Expressed in B, KB, MB, and GB.
  highestWastedBytes: 20MB

  # If the amount of wasted space makes up for X% or more of the image, mark as failed.
  # Note: the base image layer is NOT included in the total image size.
  # Expressed as a percentage between 0-1; fails if the threshold is met or crossed.
  highestUserWastedPercent: 0.20

集成到CI中，增加以下命令即可: $: CI=true dive

镜像审查和代码审查类似，是一件开始抵制，开始后就欲罢不能的事。这件事宜早不宜迟，对于企业与个人而言均百利而无一害。

随着容器化的普及，个人觉得这个工具很有前途

另外推荐一个容器的静态分析工具 clair

参考

如何对Docker Image进行审查

修改 systemd unit 文件允许远程访问

Sat, 13 Dec 2025 02:14:42 GMT

Docker 为 Client/Server 架构。

服务端为 docker daemon (daemon是守护进程的意思，进程名叫dockerd)。 docker daemon 支持三种方式的连接(unix，tcp 和 fd)。默认只使用第一种，监听/var/run/docker.sock unix套接字文件。
客户端为docker.service。一般情况下客户端和服务端运行在同一主机上，但有时候我们需要连接远程某服务器的Docker，其实和mysql有点类似。比如mysql的守护进程叫mysqld。监听3306端口，跑在一台服务器上，我们本地客户端通过IP及3306端口连接mysqld服务端，就可以操作他了。类似的，这就需要docker daemon开放tcp，要做如下设置。

注意，这样会不安全，如果你的docker daemon运行在公网上面，一旦开了监听端口，任何人都可以远程连接到docker daemon服务器进行操作）

配置远程访问Docker官方文档有详细教程 https://docs.docker.com/install/linux/linux-postinstall/

有两种方法一种是修改系统的 systemd 另一种是修改 Docker 的 daemon.json 两种方式选择一种即可，都修改会有冲突，官方建议使用第二种方式。

修改 systemd unit 文件允许远程访问

sudo systemctl edit docker.service 打开文件
添加或修改下面的

ini

[Service]
ExecStart=
ExecStart=/usr/bin/dockerd -H fd:// -H tcp://127.0.0.1:2375

保存，重启Docker sudo systemctl daemon-reload sudo systemctl restart docker.service
检查 sudo netstat -lntp | grep dockerd 会发现 Dockerd正在监听 2375 端口

修改 daemon.json 允许远程访问

打开Docker守护端的配置文件 sudo vi /etc/docker/daemon.json，检查host配置
讲host部分内容修改如下

json

{
  "hosts": ["unix:///var/run/docker.sock", "tcp://127.0.0.1:2375"]
}

同上，重启，然后检查端口

在 daemon.json 中设置 hosts 并不支持Windows和Mac Docker 桌面版

关于daemon.json 的具体配置，见官方文档

在任何装了docker客户端的机器上，测试 docker -H tcp://192.168.3.201:2375 ps

192.168.3.201 是刚才运行docker daemon的机器，如果连不上，检查防火墙是否开放了2375端口

注意

如果你修改了daemon.json，手动重启dockerd进程时也带了参数，比如dockerd --debug \ --host tcp://192.168.59.3:2376 可能会报错，即配置冲突，这时就需要用上面提到的方法，即创建docker.conf文件另外查看日志分析错误的命令:

sudo dockerd --debug 
sudo journalctl -r -u docker

错误记录

failed to start daemon: error while opening volume store metadata database: timeout

ps axf | grep docker | grep -v grep | awk '{print "kill -9 " $1}' | sudo sh sudo dockerd --debug

# 其他方法
sudo systemctl start docker
sudo kill -SIGHUP $(pidof dockerd)

你会发现dockerd其实暴露了很多API接口，比如获取和操作images，container的，还暴露了一个_ping接口，用于测试连通性，直接使用

curl http://ip:2375/_ping 如果连通正常，返回OK

具体API参见：https://docs.docker.com/engine/api/v1.40

安全性

允许Docker远程访问后一定要设置好防火墙或者用nignx加一层反向代理，也可以开启https访问，不过要生成证书，具体见下面参考中的链接。

参考

如果某层无法应用层缓存，则后续层都不能从层缓存加载

Sat, 13 Dec 2025 02:14:42 GMT

之前讲解了Docker镜像的分层机制，本节介绍下Docker的分层缓存机制。

为了加快构建速度，Docker实现了缓存：如果Dockerfile和相关文件未更改，则重建(rebuild)时可以重用本地镜像缓存中的某些现有层。但是，为了利用此缓存，您需要了解它的工作方式，这就是我们将在本文中介绍的内容。

我们来看一个使用以下Dockerfile的示例：

dockerfile

FROM python:3.7-slim-buster
COPY . .
RUN pip install --quiet -r requirements.txt
ENTRYPOINT ["python", "server.py"]

第一次运行时，所有命令都会运行：

bash

$ docker build -t example1 .
Sending build context to Docker daemon   5.12kB
Step 1/4 : FROM python:3.7-slim-buster
 ---> f96c28b7013f
Step 2/4 : COPY . .
 ---> eff791eb839d
Step 3/4 : RUN pip install --quiet -r requirements.txt
 ---> Running in 591f97f47b6e
Removing intermediate container 591f97f47b6e
 ---> 02c7cf5a3d9a
Step 4/4 : ENTRYPOINT ["python", "server.py"]
 ---> Running in e3cf483c3381
Removing intermediate container e3cf483c3381
 ---> 598b0340cc90
Successfully built 598b0340cc90
Successfully tagged example1:latest

第二次构建时，因为没有任何改变，docker构建将使用镜像缓存：

bash

$ docker build -t example1 .
Sending build context to Docker daemon   5.12kB
Step 1/4 : FROM python:3.7-slim-buster
 ---> f96c28b7013f
Step 2/4 : COPY . .
 ---> Using cache
 ---> eff791eb839d
Step 3/4 : RUN pip install --quiet -r requirements.txt
 ---> Using cache
 ---> 02c7cf5a3d9a
Step 4/4 : ENTRYPOINT ["python", "server.py"]
 ---> Using cache
 ---> 598b0340cc90
Successfully built 598b0340cc90
Successfully tagged example1:latest

请注意，上面显示的Using cache加快了构建速度(无需从网络下载任何pip依赖包)

如果我们删除镜像，则后续构建将从头开始(没有层缓存了)：

bash

$ docker image rm example1
Untagged: example1:latest
Deleted: sha256:598b0340cc90967501c5c51862dc586ca69a01ca465f48232fc457d3ab122a73
Deleted: sha256:02c7cf5a3d9af1939b9f5286312b23898fd3ea12b7cb1d7a77251251740a806c
Deleted: sha256:d9e9602d9c3fd7381a8e1de301dc4345be2eb2b8488b5fc3e190eaacbb2f9596
Deleted: sha256:eff791eb839d00cbf46d139d8595b23867bc580bb9164b90253d0b2d9fcca236
Deleted: sha256:53d34b2ead0a465d229a4260fee2a845fb8551856d4019cd2e608dfe0e039e77
$ docker build -t example1 .
Sending build context to Docker daemon   5.12kB
Step 1/4 : FROM python:3.7-slim-buster
 ---> f96c28b7013f
Step 2/4 : COPY . .
 ---> 63c32b9b1af6
...

缓存算法还有一个更重要的规则：

如果某层无法应用层缓存，则后续层都不能从层缓存加载

在以下示例中，前后两次构建过程的C层均未更改，尽管如此，由于上层并不是从层缓存中加载，因此后置的C层仍然无法从缓存中加载：

层缓存对下面的Dockerfile意味着什么？

dockerfile

FROM python:3.7-slim-buster
COPY requirements.txt .
COPY server.py .
RUN pip install --quiet -r requirements.txt
ENTRYPOINT ["python", "server.py"]

如果COPY命令的任何文件改变了，则会使后续所有层缓存失效：我们需要重新运行pip install。但是，如果server.py更改了，但requirements.txt却没有更改，为什么我们必须重做pip安装？毕竟，pip安装仅使用requirements.txt。

推及到现代编程语言：前端的依赖包文件package.json, dotnet的项目管理文件dotnetdemo.csproj等，一般很少变更；随时变动的业务代码，导致后续的层缓存失效(后续层每次都要重新下载&安装依赖)。

因此，要做的是仅复制实际需要运行下一步的那些文件，以最大程度地减少缓存失效的机会。

dockerfile

FROM python:3.7-slim-buster
COPY requirements.txt .
RUN pip install --quiet -r requirements.txt
COPY server.py .
ENTRYPOINT ["python", "server.py"]

如果想通过重用之前缓存的层来进行快速构建，则需要适当地编写Dockerfile：

仅复制下一步所需的文件，以最大程度地减少构建过程中的缓存失效。
尽量将文件可能变更的新增(ADD命令)、拷贝(COPY命令) 延迟到Dockerfile的后部。

前言

Sat, 13 Dec 2025 02:14:42 GMT

前言

Docker 容器的部署有一种在手机上装 App 的感觉，但 Docker 容器并不会像手机 App 那样会自动更新，而如果我们需要更新容器一般需要以下四个步骤：

停止容器：docker stop <CONTAINER>
删除容器：docker rm <CONTAINER>
更新镜像：docker pull <IMAGE>
启动容器：docker run <ARG> ... <IMAGE>

停止容器这个步骤可以在删除容器时使用 -f 参数来代替，即使这样还是需要三个步骤。如果部署了大量的容器需要更新使用这种传统的方式工作量是巨大的。

Watchtower 是一个可以实现自动化更新 Docker 基础镜像与容器的实用工具。它监视正在运行的容器以及相关的镜像，当检测到 registry 中的镜像与本地的镜像有差异时，它会拉取最新镜像并使用最初部署时相同的参数重新启动相应的容器，一切好像什么都没发生过，就像更新手机上的 App 一样。

快速开始

Watchtower 本身被打包为 Docker 镜像，因此可以像运行任何其他容器一样运行它：

bash

docker run -d \
    --name watchtower \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower

然后所有容器都会自动更新，也包括 Watchtower 本身。

选项参数

bash

$ docker run --rm containrrr/watchtower -h

Watchtower automatically updates running Docker containers whenever a new image is released.
More information available at https://github.com/containrrr/watchtower/.

Usage:
  watchtower [flags]

Flags:
  -a, --api-version string                          api version to use by docker client (default "1.24")
  -c, --cleanup                                     remove previously used images after updating
  -d, --debug                                       enable debug mode with verbose logging
      --enable-lifecycle-hooks                      Enable the execution of commands triggered by pre- and post-update lifecycle hooks
  -h, --help                                        help for watchtower
  -H, --host string                                 daemon socket to connect to (default "unix:///var/run/docker.sock")
  -S, --include-stopped                             Will also include created and exited containers
  -i, --interval int                                poll interval (in seconds) (default 300)
  -e, --label-enable                                watch containers where the com.centurylinklabs.watchtower.enable label is true
  -m, --monitor-only                                Will only monitor for new images, not update the containers
      --no-pull                                     do not pull any new images
      --no-restart                                  do not restart any containers
      --notification-email-delay int                Delay before sending notifications, expressed in seconds
      --notification-email-from string              Address to send notification emails from
      --notification-email-server string            SMTP server to send notification emails through
      --notification-email-server-password string   SMTP server password for sending notifications
      --notification-email-server-port int          SMTP server port to send notification emails through (default 25)
      --notification-email-server-tls-skip-verify
                                                    Controls whether watchtower verifies the SMTP server's certificate chain and host name.
                                                    Should only be used for testing.

      --notification-email-server-user string       SMTP server user for sending notifications
      --notification-email-subjecttag string        Subject prefix tag for notifications via mail
      --notification-email-to string                Address to send notification emails to
      --notification-gotify-token string            The Gotify Application required to query the Gotify API
      --notification-gotify-url string              The Gotify URL to send notifications to
      --notification-msteams-data                   The MSTeams notifier will try to extract log entry fields as MSTeams message facts
      --notification-msteams-hook string            The MSTeams WebHook URL to send notifications to
      --notification-slack-channel string           A string which overrides the webhook's default channel. Example: #my-custom-channel
      --notification-slack-hook-url string          The Slack Hook URL to send notifications to
      --notification-slack-icon-emoji string        An emoji code string to use in place of the default icon
      --notification-slack-icon-url string          An icon image URL string to use in place of the default icon
      --notification-slack-identifier string        A string which will be used to identify the messages coming from this watchtower instance (default "watchtower")
  -n, --notifications strings                        notification types to send (valid: email, slack, msteams, gotify)
      --notifications-level string                  The log level used for sending notifications. Possible values: panic, fatal, error, warn, info or debug (default "info")
      --remove-volumes                              remove attached volumes before updating
      --revive-stopped                              Will also start stopped containers that were updated, if include-stopped is active
  -R, --run-once                                    Run once now and exit
  -s, --schedule string                             the cron expression which defines when to update
  -t, --stop-timeout duration                       timeout before a container is forcefully stopped (default 10s)

自动清除旧镜像

官方给出的默认启动命令在长期使用后会堆积非常多的标签为 none 的旧镜像，如果放任不管会占用大量的磁盘空间。要避免这种情况可以加入 --cleanup 选项，这样每次更新都会把旧的镜像清理掉。

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower \
    --cleanup

--cleanup 选项可以简写为 -c

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c

选择性自动更新

某些容器可能需要稳定的运行，经常更新或重启可能会造成一些问题，这时我们可以使用一些选项参数来选择与控制容器的更新。

容器更新列表假设我们只想更新 nginx、redis 这两个容器，我们可以把容器名称追加到启动命令的最后面，就像下面这个例子：

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c \
    nginx redis

博主觉得把需要更新的容器名称写在启动命令中不利于管理，于是想了个更好的方法，建立一个更新列表文件。

bash

$ cat ~/.watchtower.list
aria2-pro
unlockmusic
mtg
...

通过变量的方式去调用这个列表：

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c \
    $(cat ~/.watchtower.list)

这样只需要调整列表后删除 Watchtower 容器并重新执行上面的命令重新启动 Watchtower 即可。

设置单个容器自动更新特征

给容器添加 com.centurylinklabs.watchtower.enable 这个 LABEL 并设置它的值为 false，或者在启动命令中加入 --label com.centurylinklabs.watchtower.enable=false 参数可以排除相应的容器。下面这个例子是博主的 openwrt-mini 镜像的容器启动命令，Watchtower 将永远忽略它的更新，即使它包含在自动更新列表中。

bash

docker run -d \
    --name openwrt-mini \
    --restart always \
    --network openwrt \
    --privileged \
    --label com.centurylinklabs.watchtower.enable=false \
    p3terx/openwrt-mini \
    /sbin/init

当容器启动命令中加入 --label com.centurylinklabs.watchtower.enable=true 参数，并且给 Watchtower 加上 --label-enable 选项时，Watchtower 将只更新这些包含此参数的容器。

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c \
    --label-enable

--label-enable 可以简写为 -e

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -ce

因为需要在容器启动时进行设置，且设置后就无法直接更改，只能重建容器，所以这种方式的灵活性不如更新列表法。尤其是在设置 com.centurylinklabs.watchtower.enable=false 参数后容器将永远被 Watchtower 忽略，也包括后面将要提到的手动更新方式，所以一般不推荐这样做，除非你愿意手动重建的原生方式更新。

设置自动更新检查频率

默认情况下 Watchtower 每 5 分钟会轮询一次，如果你觉得这个频率太高了可以使用如下选项来控制更新检查的频率，但二者只能选择其一。

--interval, -i - 设置更新检测时间间隔，单位为秒。比如每隔 1 个小时检查一次更新：

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c \
    --interval 3600

--schedule, -s - 设置定时检测更新时间。格式为 6 字段 Cron 表达式，而非传统的 5 字段，即第一位是秒。比如每天凌晨 2 点检查一次更新：

bash

docker run -d \
    --name watchtower \
    --restart unless-stopped \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c \
    --schedule "0 0 2 * * *"

手动更新

前面的使用方式都是让 Watchtower 以 detached（后台）模式在运行并自动更新容器，而 Watchtower 也支持以 foreground（前台）模式来使用，即运行一次退出并删掉容器，来实现手动更新容器。这对于偶尔更新一次那些不在自动更新列表中的容器非常有用。

对于 foreground 模式，需要加上 --run-once 这个专用的选项。下面的例子 Docker 会运行一次 Watchtower 并检查 aria2-pro 容器的基础镜像更新，最后删掉本次运行创建的 Watchtower 容器。

bash

docker run --rm \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -c \
    --run-once \
    aria2-pro

--run-once 可以简写为 -R

bash

docker run --rm \
    -v /var/run/docker.sock:/var/run/docker.sock \
    containrrr/watchtower -cR \
    aria2-pro

需要注意的是当这个容器设置过 com.centurylinklabs.watchtower.enable=false 参数时不会更新。

尾巴

以上是博主在使用 Watchtower 中总结的一些使用方式和方法，当然它还有一些其它的功能与使用方式，比如电子邮件通知、监视私人注册表的镜像、更新远程主机上的容器等，这些对于一般用户来说可能很少会用到，所以这里就不赘述了，感兴趣的小伙伴可以去研究 Watchtower 官方文档。

参考

https://github.com/containrrr/watchtower

免sudo执行docker和docker-compose

Sat, 13 Dec 2025 02:14:42 GMT

免sudo执行docker和docker-compose

官方文档有介绍

bash

# 创建名为docker的用户组
sudo groupadd docker
# 把当前用户加入到这个用户组中
sudo usermod -aG docker $USER
# 重登session
# 测试，不带sudo跑一个测试镜像
docker run hello-world

跟随系统自自动docker

sudo systemctl enable docker

Docker Machine 的目的是简化 Docker 的安装和远程管理。通过 docker-machine 命令我们可以轻松的在远程主机上安装 Docker。
pull 镜像的时候最好指定tag，不然默认会用latest。会导致版本问题。如 pull mysql 会拉最新的8.0
CMD echo $HOME ，在实际执行中，会将其变更为：CMD [ "sh", "-c", "echo $HOME" ]，所以 CMD service nginx start 不对，要使用 CMD ["nginx", "-g", "daemon off;"]

docker build 会加入上下文如果加入

.dockerignore 指定忽略目录文件

实用的命令

根据容器名称查询容器ID并删除

# 第一种写法

docker stop `docker ps -a| grep test-project | awk '{print $1}' `
docker rm   `docker ps -a| grep test-project | awk '{print $1}' `

# 第二种写法
docker stop  `docker ps -aq --filter name=test-project`
docker rm    `docker ps -aq --filter name=test-project`

根据镜像名称查询容器ID并删除

# 第一种写法
docker stop `docker ps -a| grep ygsama/test-project:1.0.2 | awk '{print $1}' `
docker rm   `docker ps -a| grep ygsama/test-project:1.0.2 | awk '{print $1}' `

# 第二种写法
docker stop  `docker ps -aq --filter ancestor=ygsama/test-project:1.0.2`
docker rm   `docker ps -aq --filter ancestor=ygsama/test-project:1.0.2`

根据镜像名称查询镜像ID并删除

docker images -q --filter reference=ygsama/test-project*:*
docker image rm `docker images -q --filter reference=10.2.21.95:10001/treasury-brain*:*`

docker-compose

env问题
重启 php-fpm
慎用 docker-compose down
环境变量优先级 shell > .env
执行 docker-compose up 之前执行先执行 docker-compose config就是把实际要运行的docker-compose.yml内容打印出来

Windows 操作系统底下经常会有文件字符集问题，比如报 :1:13: illegal character NUL，需要转换成unix文件格式可以打开 git bash 运行 dos2unix 后跟文件名

参考：

Build 上下文的概念

Sat, 13 Dec 2025 02:14:42 GMT

原文：https://www.cnblogs.com/sparkdev/p/9573248.html

Dockerfile 中提供了两个非常相似的命令 COPY 和 ADD，本文尝试解释这两个命令的基本功能，以及其异同点，然后总结其各自适合的应用场景。

Build 上下文的概念

在使用 docker build 命令通过 Dockerfile 创建镜像时，会产生一个 build 上下文(context)。所谓的 build 上下文就是 docker build 命令的 PATH 或 URL 指定的路径中的文件的集合。在镜像 build 过程中可以引用上下文中的任何文件，比如我们要介绍的 COPY 和 ADD 命令，就可以引用上下文中的文件。

默认情况下 docker build -t testx . 命令中的 . 表示 build 上下文为当前目录。当然我们可以指定一个目录作为上下文，比如下面的命令： docker build -t testx /home/nick/hc 我们指定 /home/nick/hc 目录为 build 上下文，默认情况下 docker 会使用在上下文的根目录下找到的 Dockerfile 文件。

COPY 和 ADD 命令不能拷贝上下文之外的本地文件

对于 COPY 和 ADD 命令来说，如果要把本地的文件拷贝到镜像中，那么本地的文件必须是在上下文目录中的文件。其实这一点很好解释，因为在执行 build 命令时，docker 客户端会把上下文中的所有文件发送给 docker daemon。考虑 docker 客户端和 docker daemon 不在同一台机器上的情况，build 命令只能从上下文中获取文件。如果我们在 Dockerfile 的 COPY 和 ADD 命令中引用了上下文中没有的文件，就会收到类似下面的错误：

与 WORKDIR 协同工作

WORKDIR 命令为后续的 RUN、CMD、COPY、ADD 等命令配置工作目录。在设置了 WORKDIR 命令后，接下来的 COPY 和 ADD 命令中的相对路径就是相对于 WORKDIR 指定的路径。比如我们在 Dockerfile 中添加下面的命令：

WORKDIR /app
COPY checkredis.py .

然后构建名称为 testx 的容器镜像，并运行一个容器查看文件路径：

checkredis.py 文件就是被复制到了 WORKDIR /app 目录下。

COPY 命令的简单性

如果仅仅是把本地的文件拷贝到容器镜像中，COPY 命令是最合适不过的。其命令的格式为： COPY

除了指定完整的文件名外，COPY 命令还支持 Go 风格的通配符，比如：

COPY check* /testdir/           # 拷贝所有 check 开头的文件
COPY check?.log /testdir/       # ? 是单个字符的占位符，比如匹配文件 check1.log

对于目录而言，COPY 和 ADD 命令具有相同的特点：**只复制目录中的内容而不包含目录自身。**比如我们在 Dockerfile 中添加下面的命令：

WORKDIR /app
COPY nickdir .

其中 nickdir 目录的结构如下：

重新构建镜像 testx，运行一个容器并查看 /app 目录下的内容：

这里只有 file1 和 file2，少了一层目录 nickdir。如果想让 file1 和 file2 还保存在 nickdir 目录中，需要在目标路径中指定这个目录的名称，比如：

WORKDIR /app
COPY nickdir ./nickdir

**COPY 命令区别于 ADD 命令的一个用法是在 multistage 场景下。**关于 multistage 的介绍和用法请参考笔者的《Dockerfile 中的 multi-stage》一文。在 multistage 的用法中，可以使用 COPY 命令把前一阶段构建的产物拷贝到另一个镜像中，比如：

FROM golang:1.7.3
WORKDIR /go/src/github.com/sparkdevo/href-counter/
RUN go get -d -v golang.org/x/net/html
COPY app.go    .
RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o app .

FROM alpine:latest
RUN apk --no-cache add ca-certificates
WORKDIR /root/
COPY --from=0 /go/src/github.com/sparkdevo/href-counter/app .
CMD ["./app"]

这段代码引用自《Dockerfile 中的 multi-stage》一文，其中的 COPY 命令通过指定 --from=0 参数，把前一阶段构建的产物拷贝到了当前的镜像中。

ADD 命令还可以干其它事情

ADD 命令的格式和 COPY 命令相同，也是： ADD

除了不能用在 multistage 的场景下，ADD 命令可以完成 COPY 命令的所有功能，并且还可以完成两类超酷的功能：

解压压缩文件并把它们添加到镜像中
从 url 拷贝文件到镜像中

当然，这些功能也让 ADD 命令用起来复杂一些，不如 COPY 命令那么直观。

解压压缩文件并把它们添加到镜像中 如果我们有一个压缩文件包，并且需要把这个压缩包中的文件添加到镜像中。需不需要先解开压缩包然后执行 COPY 命令呢？当然不需要！我们可以通过 ADD 命令一次搞定：

WORKDIR /app
ADD nickdir.tar.gz .

这应该是 ADD 命令的最佳使用场景了！

从 url 拷贝文件到镜像中 这是一个更加酷炫的用法！但是在 docker官方文档的最佳实践中却强烈建议不要这么用！！docker 官方建议我们当需要从远程复制文件时，最好使用 curl 或 wget 命令来代替 ADD 命令。原因是，当使用 ADD 命令时，会创建更多的镜像层，当然镜像的 size 也会更大(下面的两段代码来自 docker 官方文档)：

ADD http://example.com/big.tar.xz /usr/src/things/
RUN tar -xJf /usr/src/things/big.tar.xz -C /usr/src/things
RUN make -C /usr/src/things all

如果使用下面的命令，不仅镜像的层数减少，而且镜像中也不包含 big.tar.xz 文件：

RUN mkdir -p /usr/src/things \
    && curl -SL http://example.com/big.tar.xz \
    | tar -xJC /usr/src/things \
    && make -C /usr/src/things all

好吧，看起来只有在解压压缩文件并把它们添加到镜像中时才需要 ADD 命令！

加速镜像构建的技巧

在使用 COPY 和 ADD 命令时，我们可以通过一些技巧来加速镜像的 build 过程。比如把那些最不容易发生变化的文件的拷贝操作放在较低的镜像层中，这样在重新 build 镜像时就会使用前面 build 产生的缓存。比如笔者构建镜像时需要用到下面几个文件：

其中 myhc.py 文件不经常变化，而 checkmongo.py、checkmysql.py 和 checkredis.py 这三个文件则经常变化，那么我们可这样来设计 Dockerfile 文件：

WORKDIR /app
COPY myhc.py .
COPY check* ./

让 COPY myhc.py . 单独占据一个镜像层，当 build 过一次后，每次因 checkmongo.py、checkmysql.py 和 checkredis.py 这三个文件变化而导致的重新 build 都不会重新 build COPY myhc.py . 镜像层：

如上图所示，第二步和第三步都没有重新 build 镜像层，而是使用了之前的缓存，从第四步才开始重新 build 了镜像层。当文件 size 比较大且文件的数量又比较多，尤其是需要执行安装等操作时，这样的设计对于 build 速度的提升还是很明显的。所以我们应该尽量选择能够使用缓存的 Dockerfile 写法。

当第一次看到 COPY 和 ADD 命令时不免让人感到疑惑。但分析之后大家会发现 COPY 命令是为最基本的用法设计的，概念清晰，操作简单。而 ADD 命令基本上是 COPY 命令的超集(除了 multistage 场景)，可以实现一些方便、酷炫的拷贝操作。ADD 命令在增加了功能的同时也增加了使用它的复杂度，比如从 url 拷贝压缩文件时弊大于利。希望本文能够解去大家对 Dockerfile 中 COPY 和 ADD 命令的疑惑。

参考

account 账户管理

Sat, 13 Dec 2025 02:14:42 GMT

Docker Desktop v3.0 已于前两周正式发布，从这个版本起，Docker 官方承诺每次的更新将以增量更新的方式来提供，以便减少下载包的体积，提升效率。

除了将 Docker Engine 更新至 v20.10.0 外，还新增了一个Docker Hub CLI 工具直接hub-tool -h

本文已hub-tool v0.2.0为准

bash

A tool to manage your Docker Hub images

Usage:
  hub-tool
  hub-tool [command]

Available Commands:
  account     Manage your account
  help        Help about any command
  login       Login to the Hub
  logout      Logout of the Hub
  org         Manage organizations
  repo        Manage repositories
  tag         Manage tags
  token       Manage Personal Access Tokens
  version     Version information about this tool

Flags:
  -h, --help      help for hub-tool
      --verbose   Print logs
      --version   Display the version of this tool

Use "hub-tool [command] --help" for more information about a command.

从一级菜单来看，主要功能包括：

登录/登出 DockerHub;
账户相关管理功能；
组织相关管理功能；
仓库和 tag 的相关管理功能；
token 的相关管理功能；

但这里需要注意的是 Hub Tool 并没有使用 Docker Desktop 默认的用户凭证，也就是说，即使你在 Docker Desktop 中已经登录了帐号，你同样还是需要再次在终端下执行 login 操作。

account 账户管理

包含info和rate-limiting两个子命令对于免费用户每 6 小时只允许 pull 200 次 200 container image requests per 6 hours 详情或最新政策见官网

bash

> hub-tool account info
Username:	finleyma
Full name:
Company:
Location:
Joined:		3 years ago
Plan:		free
Limits:
  Seats:		1
  Private repositories:	1
  Parallel builds:	1
  Collaborators:	unlimited
  Teams:		unlimited

bash

> hub-tool account rate-limiting
  Limit:     200, 6 hours window
  Remaining: 200, 6 hours window

repo 仓库和tag管理

查看repo列表和删除repo

bash

> hub-tool repo ls
REPOSITORY                                 DESCRIPTION    LAST UPDATE      PULLS    STARS    PRIVATE
finleyma/simplewhale                                      7 weeks ago      9        0        false
finleyma/express                                          16 months ago    61       0        false
finleyma/yapi                                             16 months ago    10       0        false
finleyma/circleci-nodejs-browser-awscli                   23 months ago    331      0        false
finleyma/phpenv                                           2 years ago      24       0        false
finleyma/my-first-flask-app                               3 years ago      58       0        false

列出repo的所有tag

bash

> hub-tool tag ls finleyma/express

查看镜像详情

bash

> hub-tool tag inspect finleyma/express

org 组织和token管理

这个比较简单， hub-tool org展示一些组织和成员相关信息。 hub-tool token对个人 Token 的创建/删除，激活/失效，列表，查询详细等功能。

参考

https://segmentfault.com/a/1190000038629701

Docker In Docker

Sat, 13 Dec 2025 02:14:42 GMT

Docker In Docker

就是在docker内运行Docker,一个常用的场景是我们用Docker起了一个Jenkins，Jenkins构建项目的时候，为了保证项目环境是干净的，也需要拉一个docker镜像，把项目放到干净的容器中。

在Docker容器中运行Docker

在Docker中实现Docker的三种方法

通过挂载docker.sock（DooD方法）运行docker
dind 方法
使用Nestybox sysbox Docker运行时

方法1：使用[/var/run/docker.sock]的Docker中运行Docker

/var/run/docker.sock是默认的Unix套接字。套接字用于在同一主机上的进程之间进行通信。 Docker守护程序默认情况下侦听docker.sock。如果您在运行Docker守护程序的主机上，则可以使用/var/run/docker.sock管理容器。

例如，如果运行以下命令，它将返回docker engine的版本。

curl --unix-socket /var/run/docker.sock http://localhost/version

要在docker内部运行docker，要做的只是在默认Unix套接字docker.sock作为卷的情况下运行docker。 -v /var/run/docker.sock:/var/run/docker.sock

WARNING

如果您的容器可以访问docker.sock，则意味着它具有对docker守护程序的更多特权。因此，在实际项目中使用时，请了解并使用安全隐患。因为容器的docker可以访问并删除宿主机的所有镜像

现在，从容器中应该能够执行docker命令来构建镜像并将其推送到镜像仓库。在这里，实际的docker操作发生在运行docker容器的VM主机上，而不是在容器内部进行。意思是，即使您正在容器中执行docker命令，也指示Docker客户端通过以下docker.sock方式连接到VM主机docker-engine。

上面的意思是，假如Jenkins是运行在容器中，在Jenkins中执行docker run...和在服务器上(就是宿主机)直接执行docker run效果一样。这样很方便，但是也比较危险。

方法2：Docker In Docker

此方法实际上在容器内部创建一个子容器。仅当确实要在容器中包含容器和镜像时才使用此方法。否则，建议使用第一种方法。为此，只需要使用带有dind标签的官方docker镜像即可。

建立一个以docker:dind为镜像，名字为some-docker的docker容器

docker run --privileged --name some-docker -v /my/own/var-lib-docker:/var/lib/docker -d docker:dind

使用exec登录到容器。 docker exec -it some-docker /bin/sh

登录后可以执行docker build等docker命令了

WARNING

为了对主机环境的完全访问，--privileged 特权模式是必须的

方法3：使用Sysbox运行时的Docker中的Docker

Sysbox 是nestybox公司旗下的一款产品，当允许Docker容器充当虚拟服务器，能够在其中运行Systemd、Docker和Kubernetes等软件，操作容易且具有适当的隔离。

比前两种好处是避免了访问宿主机

安装sysbox运行时环境
使用sysbox运行时标志启动docker容器，还使用官方的docker:dind镜像 docker run --runtime=sysbox-runc --name sysbox-dind -d docker:dind
进入sysbox-dind容器 `docker exec -it sysbox-dind /bin/sh
可以在里面构建docker镜像了

总结

使用docker.sock和dind方法在docker中运行docker的安全性较差，因为它具有对docker守护程序的完全特权

参考

https://forum.gitlab.com/t/why-services-docker-dind-is-needed-while-already-having-image-docker/43534/7

容器网络调试工具 netshoot

Sat, 13 Dec 2025 02:14:42 GMT

容器网络调试工具 netshoot

网络问题是我们使用容器技术时候经常碰到的问题，容器明明启动成功了就是ping不通，为了使容器尽量精简，有时并没有top,ps,netstat等网络命令，有一个方法是再启动一个包含很多工具命令的容器连接到出问题的容器同一网络进行调试，netshoot就是这样的工具

源码其实非常简单,可以把他想象成一个调试外挂，哪个容器出问题了，就把他挂到同一网络。

dockerfile

FROM debian:stable-slim as fetcher
COPY build/fetch_binaries.sh /tmp/fetch_binaries.sh

RUN apt-get update && apt-get install -y \
  curl \
  wget

RUN /tmp/fetch_binaries.sh

FROM alpine:3.13

RUN set -ex \
    && echo "http://nl.alpinelinux.org/alpine/edge/main" >> /etc/apk/repositories \
    && echo "http://nl.alpinelinux.org/alpine/edge/testing" >> /etc/apk/repositories \
    && echo "http://nl.alpinelinux.org/alpine/edge/community" >> /etc/apk/repositories \
    && apk update \
    && apk upgrade \
    && apk add --no-cache \
    apache2-utils \
    bash \
    bind-tools \
    bird \
    bridge-utils \
    busybox-extras \
    conntrack-tools \
    curl \
    dhcping \
    drill \
    ethtool \
    file\
    fping \
    iftop \
    iperf \
    iproute2 \
    ipset \
    iptables \ 
    iptraf-ng \
    iputils \
    ipvsadm \
    jq \
    libc6-compat \
    liboping \
    mtr \
    net-snmp-tools \
    netcat-openbsd \
    nftables \
    ngrep \
    nmap \
    nmap-nping \
    openssl \
    py3-pip \
    py3-setuptools \
    scapy \
    socat \
    speedtest-cli \
    strace \
    tcpdump \
    tcptraceroute \
    tshark \
    util-linux \
    vim \ 
    git \
    zsh \
    websocat

# Installing httpie ( https://httpie.io/docs#installation)
RUN pip3 install --upgrade httpie

# Installing ctop - top-like container monitor
COPY --from=fetcher /tmp/ctop /usr/local/bin/ctop

# Installing calicoctl
COPY --from=fetcher /tmp/calicoctl /usr/local/bin/calicoctl

# Installing termshark
COPY --from=fetcher /tmp/termshark /usr/local/bin/termshark

# Setting User and Home
USER root
WORKDIR /root
ENV HOSTNAME netshoot

# ZSH Themes
RUN wget https://github.com/robbyrussell/oh-my-zsh/raw/master/tools/install.sh -O - | zsh || true
RUN git clone https://github.com/zsh-users/zsh-autosuggestions ${ZSH_CUSTOM:-~/.oh-my-zsh/custom}/plugins/zsh-autosuggestions
RUN git clone --depth=1 https://github.com/romkatv/powerlevel10k.git ${ZSH_CUSTOM:-$HOME/.oh-my-zsh/custom}/themes/powerlevel10k
COPY zshrc .zshrc
COPY motd motd

# Fix permissions for OpenShift
RUN chmod -R g=u /root

# Running ZSH
CMD ["zsh"]

容器网络基础

Docker

bridge 模式是 Docker 默认的网络设置，此模式会为每一个容器分配 Network Namespace、设置 IP 等，并将一个主机上的 Docker 容器连接到一个虚拟网桥上。当 Docker server 启动时，会在主机上创建一个名为 docker0 的虚拟网桥，此主机上启动的 Docker 容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似，这样主机上的所有容器就通过交换机连在了一个二层网络中。接下来就要为容器分配 IP 了，Docker 会从 RFC1918 所定义的私有 IP 网段中，选择一个和宿主机不同的IP地址和子网分配给 docker0，连接到 docker0 的容器就从这个子网中选择一个未占用的 IP 使用。如一般 Docker 会使用 172.17.0.0/16 这个网段，并将 172.17.42.1/16 分配给 docker0 网桥（在主机上使用 ifconfig 命令是可以看到 docker0 的，可以认为它是网桥的管理接口，在宿主机上作为一块虚拟网卡使用）

Kubernetes

Kubernetes也使用Network Namespace概念。 Kubernetes为每个pod创建一个Network Namespace，其中该pod中的所有容器共享相同的网络名称空间(IP, tcp sockets等)。这是Docker容器和Kubernetes之间的一个关键区别。

举例

这个例子来自docker官网 https://docs.docker.com/get-started/07_multi_container/

下面的命令，创建了名称为todo-app的网络，起了个mysql容器，这个容器在网络中的名称是mysql，由--network-alias指定

bash

docker network create todo-app
docker run -d \
     --network todo-app --network-alias mysql \
     -v todo-mysql-data:/var/lib/mysql \
     -e MYSQL_ROOT_PASSWORD=secret \
     -e MYSQL_DATABASE=todos \
     mysql:5.7
docker exec -it <mysql-container-id> mysql -u root -p

下面我们启动netshoot容器并加入同一网络，进入容器，使用dig命令来通过主机名查看IP地主

bash

docker run -it --network todo-app nicolaka/netshoot
dig mysql

返回内容类似

bash

 ; <<>> DiG 9.14.1 <<>> mysql
 ;; global options: +cmd
 ;; Got answer:
 ;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 32162
 ;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 0

 ;; QUESTION SECTION:
 ;mysql.				IN	A

 ;; ANSWER SECTION:
 mysql.			600	IN	A	172.23.0.2

 ;; Query time: 0 msec
 ;; SERVER: 127.0.0.11#53(127.0.0.11)
 ;; WHEN: Tue Oct 01 23:47:24 UTC 2019
 ;; MSG SIZE  rcvd: 44

还有种更简单的方式 docker run -it --net container: nicolaka/netshoot

如果要排查宿主机的网络问题 docker run -it --net host nicolaka/netshoot

参考

https://docs.docker.com/get-started/07_multi_container/

https://docs.docker.com/engine/reference/commandline/network_create/#bridge-driver-options

https://www.huaweicloud.com/articles/5bb8f4efe7aaca9d4332750d73876db8.html

1. 启用 Buildx

Sat, 13 Dec 2025 02:14:42 GMT

Docker Buildx 是一个 docker CLI 插件，其扩展了 docker 命令，支持 Moby BuildKit 提供的功能。提供了与 docker build 相同的用户体验，并增加了许多新功能。 BuildKit 是下一代的镜像构建组件，主要特点有很多，本文主要使用其可以编译多种系统架构的特性。

网址：https://github.com/moby/buildkit

需要注意的是，该功能仅适用于 Docker v19.03+ 版本。

本文将讲解如何使用 Buildx 构建多种系统架构的镜像。在开始之前，已经默认你在 Linux 系统（各大发行版）下安装好了 64 位的 Docker。在写本文时，Docker 最新版本号是 20.10.0。

$ docker version

Client: Docker Engine - Community
 Version:           20.10.0
 API version:       1.41
 Go version:        go1.13.15
 Git commit:        7287ab3
 Built:             Tue Dec  8 18:59:53 2020
 OS/Arch:           linux/amd64
 Context:           default
 Experimental:      true

Server: Docker Engine - Community
 Engine:
  Version:          20.10.0
  API version:      1.41 (minimum version 1.12)
  Go version:       go1.13.15
  Git commit:       eeddea2
  Built:            Tue Dec  8 18:57:44 2020
  OS/Arch:          linux/amd64
  Experimental:     false
 containerd:
  Version:          1.4.3
  GitCommit:        269548fa27e0089a8b8278fc4fc781d7f65a939b
 runc:
  Version:          1.0.0-rc92
  GitCommit:        ff819c7e9184c13b7c2607fe6c30ae19403a7aff
 docker-init:
  Version:          0.19.0
  GitCommit:        de40ad0
ubuntu@VM-16-4-ubuntu:~$

1. 启用 Buildx

buildx 命令属于实验特性，因此首先需要开启该特性。上面的查看 Docker 版本返回的内容中，如果出现Experimental: true字样就代表已经开启该特性了。下面的这一步骤就可以省略。编辑~/.docker/config.json 文件，新增如下内容（以下的演示适用于事先不存在 .docker 目录的情况下）

$ mkdir ~/.docker
$ cat > ~/.docker/config.json <<EOF
{
"experimental": "enabled"
}
EOF

Linux/macOS 下或者通过设置环境变量的方式（不推荐）：

$ export DOCKER_CLI_EXPERIMENTAL=enabled

2. 新建 builder 实例

在 Docker 19.03+ 版本中可以使用 docker buildx build 命令使用 BuildKit 构建镜像。该命令支持 --platform 参数可以同时构建支持多种系统架构的 Docker 镜像，大大简化了构建步骤。

由于 Docker 默认的 builder 实例不支持同时指定多个 --platform ，我们必须首先创建一个新的 builder 实例。 $ docker buildx create --name mybuilder --driver docker-container

返回新的 builder 实例名，为「mybuilder」

mybuilder

使用新创建好的 builder 实例

$ docker buildx use mybuilder

查看已有的 builder 实例

$ docker buildx ls
NAME/NODE    DRIVER/ENDPOINT             STATUS   PLATFORMS
mybuilder *  docker-container
  mybuilder0 unix:///var/run/docker.sock inactive 
default      docker
  default    default                     running  linux/amd64, linux/386

Docker 在 linux/amd64 系统架构下是不支持 arm 架构镜像，因此我们可以运行一个新的容器（emulator）让其支持该特性，Docker 桌面版则无需进行此项设置。

方法一：

$ docker run --rm --privileged docker/binfmt:a7996909642ee92942dcd6cff44b9b95f08dad64

注：docker/binfmt 可以参考网址：https://hub.docker.com/r/docker/binfmt/tags 获取最新镜像

方法二（推荐）：

$ docker run --rm --privileged tonistiigi/binfmt --install all

去参考网址：https://hub.docker.com/r/tonistiigi/binfmt 获取最新镜像。目前（2021/09/02 更新）的 Qemu version: 6.0.0

3. 新建 Dockerfile 文件

要想构建多种系统架构的镜像，还需要一个支持的 Dockerfile 文件。以下是一个示例的 Dockerfile 文件。参考链接：https://github.com/teddysun/across/blob/master/docker/kms/Dockerfile.architecture

该 Dockerfile 文件内容如下：

FROM --platform=$TARGETPLATFORM alpine:latest AS builder
WORKDIR /root
RUN apk add --no-cache git make build-base && \
    git clone --branch master --single-branch https://github.com/Wind4/vlmcsd.git && \
    cd vlmcsd/ && \
    make

FROM --platform=$TARGETPLATFORM alpine:latest
LABEL maintainer="Teddysun <[email protected]>"

COPY --from=builder /root/vlmcsd/bin/vlmcsd /usr/bin/vlmcsd
EXPOSE 1688
CMD [ "vlmcsd", "-D", "-e" ]

$TARGETPLATFORM 是内置变量，由 --platform 参数来指定其值。由于是基于 alpine 的镜像来制作的，而 alpine 是支持以下 7 种系统架构的，因此我们制作的镜像也就跟着支持这 7 种系统架构。

linux/amd64, linux/arm/v6, linux/arm/v7, linux/arm64, linux/386, linux/ppc64le, linux/s390x

更友好一点的架构名称如下：

amd64, arm32v6, arm32v7, arm64v8, i386, ppc64le, s390x

这里穿插一句吐槽。简单统计了一下，ARM 的系统架构有如下各种简称：

arm64, armv8l, arm64v8, aarch64
arm, arm32, arm32v7, armv7, armv7l, armhf
arm32v6, armv6, armv6l, arm32v5, armv5,  armv5l, armel, aarch32

看完了是不是很想打人？而对比 Intel 和 AMD 的就简单多了：

x86, 386, i386, i686
x86_64, x64, amd64

4. 构建镜像

先来本地构建一个。

git clone 刚才的示例 Dockerfile 文件，并进入其目录下

$ cd ~ && git clone https://github.com/teddysun/across.git && cd across/docker/kms/

在本地构建支持 7 种 platform 的镜像

$ docker buildx build --platform linux/amd64,linux/arm/v6,linux/arm/v7,linux/arm64,linux/ppc64le,linux/s390x,linux/386 -t teddysun/kms -o type=local,dest=.docker -f ./Dockerfile.architecture .

docker buildx build 的具体参数含义，参考下面的官方文档 https://docs.docker.com/engine/reference/commandline/buildx_build/

做完上面的那一步，实际上是把构建好的镜像放在了本地路径下。此时我们再来查看一下已有的 builder 实例。

$ docker buildx ls
NAME/NODE    DRIVER/ENDPOINT             STATUS  PLATFORMS
mybuilder *  docker-container                    
  mybuilder0 unix:///var/run/docker.sock running linux/amd64, linux/arm64, linux/riscv64, linux/ppc64le, linux/s390x, linux/386, linux/arm/v7, linux/arm/v6
default      docker                              
  default    default                     running linux/amd64, linux/386

你会发现 mybuilder 下存在 8 种支持的架构（riscv64 目前还用不上，但是已经支持）。

此时查看一下 docker image 的运行情况，会发现存在一个名为 buildx_buildkit_mybuilder0 的容器在运行。这是刚才在本地构建时，自动创建的，切记不要将其停止，也不要删除。

$ docker ps -as
CONTAINER ID        IMAGE                           COMMAND           CREATED             STATUS              PORTS             NAMES                        SIZE
be753fa16090        moby/buildkit:buildx-stable-1   "buildkitd"       15 minutes ago      Up 15 minutes                         buildx_buildkit_mybuilder0   0B (virtual 78.6MB)

再来构建一个多系统架构镜像，并将构建好的镜像推送到 Docker 仓库（也就是 hub.docker.com）。

在此操作之前，你需要事先注册一个账号（演示过程省略），并登录。登录命令如下：

$ docker login

输入你的用户名和密码即可登录。

注意，以下演示的命令中 tag 的前面是我的用户名 finley，如果你想制作自己的镜像，请自行替换为你自己的用户名。使用 --push 参数构建好的镜像推送到 Docker 仓库。此时仍然是在刚才的 ~/across/docker/kms 目录下，文件 Dockerfile.architecture 是为多系统架构构建准备的。命令如下：

$ docker buildx build --platform linux/386,linux/amd64,linux/arm/v6,linux/arm/v7,linux/arm64,linux/ppc64le,linux/s390x -t finley/kms --push -f ./Dockerfile.architecture .

命令执行成功后，你就会在 Docker Hub 看到你上传的镜像啦。

5. 写在最后

在制作多系统架构的 Docker 镜像时，建议使用 CPU 比较强或者多核心的 VPS 来构建，否则会非常耗时。

参考

https://github.com/moby/buildkit

https://teddysun.com/581.html

https://kubesphereio.com/post/docker-image-operation-guide-for-building-arm-x86-architecture/

Sat, 13 Dec 2025 02:14:42 GMT

Docker官方提供了类似 github的平台，叫 https://hub.docker.com 可以 pull 官方或第三方提供的镜像，当然也可以发布自己的镜像供别人下载，互相学习。

大致流程：

docker hub 平台注册账号 -> docker login (登录) -> docker image ls (查看本地镜像) -> docker push （如 docker push finleyma/phpenv:tp3.2）

注册完成后如果要发布本地自己制作好的镜像，要执行命令先执行 docker image ls 查看本地存在的镜像然后 docker push 某镜像 , 比如提交上篇制作好的镜像

刷新docker hub的个人 REPOSITORY 页面，会看到已经存在了 https://hub.docker.com/r/finleyma/phpenv/

这样的话其他项目成员可以直接执行 docker run -it -p 8089:80 -v [本地项目路径]:/var/www "finleyma/phpenv:tp3.2" /bin/bash 进到终端只需 webserver start 启动服务。

参考

Sat, 13 Dec 2025 02:14:42 GMT

某些网络环境下，我们拉取不到官方docker hub的镜像。提供几种思路：

提前用docker pull把镜像拉到本地
搭建内部使用的镜像仓库，把镜像同步进来

流程也非常简单，docker pull先拉下来，然后重新打tag，最后push到我们自己的仓库

bash

sudo docker pull registry.cn-hangzhou.aliyuncs.com/lfy_ruoyi/ruoyi-visual-monitor:v2
docker images
docker tag eb5aeb93fe3b finleyma/ruoyi-visual-monitor:v2
docker login
docker push finleyma/ruoyi-visual-monitor:v2

更进一步，创建俩文件一个是待同步的镜像列表，一个是脚本文件，执行后会同步镜像

run.sh

#!/bin/bash

file="images.txt"
username="finleyma"

while read -r line
do
	new_image=`echo ${line#*/} | sed 's|/|-|g'`
	echo "docker pull ${line}"
	echo "docker tag ${line} ${username}/${new_image}"
	echo "docker push v5cn/${new_image}"
done < "$file"

images.txt

k8s.gcr.io/defaultbackend-amd64:1.5
k8s.gcr.io/ingress-nginx/controller:v0.46.0
k8s.gcr.io/pause:3.2
k8s.gcr.io/kube-controller-manager:v1.19.7
k8s.gcr.io/kube-scheduler:v1.19.7
k8s.gcr.io/kube-proxy:v1.19.7
k8s.gcr.io/kube-apiserver:v1.19.7
k8s.gcr.io/etcd:3.4.13-0
k8s.gcr.io/coredns:1.7.0
quay.io/kubernetes-ingress-controller/nginx-ingress-controller:0.26.1

其实harbor自带了镜像同步功能

以一个把dockerhub的名称为finleyma/raco-bird的镜像同步到harbor为例

左侧菜单：仓库管理 - 创建目标，弹出的对话框中

目标名: hub.docker.com

目标URL: https://hub.docker.com

左侧菜单：复制管理 - 添加规则

名称: raco-bird
描述: 同步docker hub的finleyma/raco-bird到harbor

源资源过滤器: finleyma/raco-bird
Ta: latest
触发模式: 手动
勾选: 覆盖和启动规则

点击"复制"按钮

使用工具 image-syncer

涉及到下载和上传，注意服务器上传带宽限制

参考

https://www.lishuai.fun/2020/11/05/harbor-proxy/

Sat, 13 Dec 2025 02:14:42 GMT

我们以这个tarampampam/node-docker

这个是我自己常用的镜像，作者制作的很优秀，有以下特点：

基于官方的node基础镜像，加入了git,bash,openssh这三个常用的工具
支持多个arm64，armv7，amd64等5种架构
基于Github actions同步官方镜像的tag，每小时重新制作，举个例子，目前node的文档版本是v14，我如果 docker run tarampampam/node:lts-alpine, node -v 会返回14，这样没错。但是如果第二天官方的lts变为了node16。tarampampam/node:lts-alpine也需要更新为16。 Github actions支持定时任务的，作者写了个脚本，每小时去Dockerhub抓tag，和上游保持更新。

阅读他的代码可以学习github actions一些知识，回头我再详细介绍

事故缘由

Sat, 13 Dec 2025 02:14:42 GMT

以一个网上的例子说下恢复数据。有一个wordpress站点是用docker-compose部署的，内容为

事故缘由

yaml

version: "2.3"

services:
  wordpress:
    image: wordpress
    restart: always
    ports:
      - "127.0.0.1:8090:80"
    environment:
      WORDPRESS_DB_PASSWORD: root
  mysql:
    image: mysql:5.7
    restart: always
    environment:
      MYSQL_ROOT_PASSWORD: root

为了给容器添加healthcheck，添加了以下几行

yaml

@@ -8,6 +8,12 @@
       - "127.0.0.1:8090:80"
     environment:
       WORDPRESS_DB_PASSWORD: root
+    healthcheck:
+      test: "curl -f http://127.0.0.1"
+      interval: 30s
+      timeout: 5s
+      retries: 1
+      start_period: 10s
   mysql:
     image: mysql:5.7
     restart: always

由于此前多次重启机器，容器均会自动重启（restart: always），放低了警惕，没有考虑到更新 docker-compose.yml 后重启服务会删除之前容器。

于是运行了 docker-compose down && docker-compose up -d，此时原容器被删除了（访问 127.0.0.1 显示 Wordpress 安装界面，使用 mysql 工具打开数据库显示 wordpress 数据库为空）。

数据找回

这时候不要慌，/var/lib/docker/volumes/ 下查找是否有尚未删除的 volume。查看了一下每个 volume，发现了两个 wordpress 目录和一个 mysql 目录。最终通过 mtime 确定了两个最后修改于当日的 volume，且 cd 进去后发现确实一个是 Wordpress，一个是 MySQL

复制 volume 数据到 named volume。我使用了 docker_clone_volume.sh，这个 Shell Script 创建了一个 Alpine 容器，将原 volume 和新 volume 挂载到容器内，使用 cp -av src dst 直接复制。
修改 docker-compose.yml 文件挂载新的 named volume

yaml

@@ -14,8 +14,17 @@
       timeout: 5s
       retries: 1
       start_period: 10s
 +    volumes:
 +      - wordpress:/var/www/html
   mysql:
     image: mysql:5.7
     restart: always
     environment:
       MYSQL_ROOT_PASSWORD: root
 +    volumes:
 +      - mysql:/var/lib/mysql
 +volumes:
 +  wordpress:
 +    external: true
 +  mysql:
 +    external: true

重启并恢复服务 docker-compose up -d

总结

运维角度最好从 Docker 级别也做好备份
对于有状态的服务，比如站点目录，和数据库数据目录，创建volume，并定时备份
volume放到宿主机也是100%安全，可以备份到云服务对象存储

镜像制作最佳实践

Sat, 13 Dec 2025 02:14:42 GMT

镜像制作最佳实践

使用官方的镜像作为基础镜像

基础镜像的标签不要使用latest
使用.dockerignore 文件
最经常变化的命令越往后执行充分利用缓存机制

把 copy myapp /app 放到后面，因为myapp是源码目录，是会经常发生变动的，一旦该层内容发生变动，那么后续的层都会重新执行

这是优化后的执行顺序

dockerfile中每行命令产生一层，请最大限度减少层数
当Dockerfile的指令修改了，复制的文件变化了，或者构建镜像时指定的变量不同了，对应的镜像层缓存就会失效。某一层的镜像缓存失效之后，它之后的镜像层缓存都会失效
使用CMD和ENTRYPOINT时，请务必使用数组语法。CMD /bin/echo 会在你的命令前面加上/bin/sh -c 可能导致意想不到的问题
使用多步构建 multi staging
不要使用root用户避免潜在的风险
使用 docker scan 命令扫描风险

参考

https://www.qikqiak.com/post/dockerfile-best-practice/

1.首先创建一个secret，类型为docker-creds

Sat, 13 Dec 2025 02:14:42 GMT

Docker并不是唯一的容器化工具,可能还有更好的选择, Docker有个弊端, 需要Daemon来运行还需要root特权比如我想在容器里构建镜像。我需要把/var/run/docker.sock挂载在容器里, 然后在容器里构建镜像。导致我们可以直接执行docker images看到所有镜像，甚至删除他们！在多人开发中这是非常危险的!

这里推荐使用kaniko, 它是一个非常好的选择。

Kaniko使用自己的“executor”执行构建步骤

下面我们来举个例子

1.首先创建一个secret，类型为docker-creds

bash

export REGISTRY_SERVER=https://index.docker.io/v1/

# Replace `[...]` with the registry username
export REGISTRY_USER=[...]

# Replace `[...]` with the registry password
export REGISTRY_PASS=[...]

kubectl create secret \
    docker-registry regcred \
    --docker-server=$REGISTRY_SERVER \
    --docker-username=$REGISTRY_USER \
    --docker-password=$REGISTRY_PASS

2.创建一个pod，挂载刚创建的secret

Pod 是 K8s 中的概念

yaml

---

apiVersion: v1
kind: Pod
metadata:
  namespace: kaniko
  name: kaniko
spec:
  containers:
  - name: kaniko
    image: gcr.io/kaniko-project/executor:debug
    args:
      - '--context=git://github.com/mafeifan/kaniko-demo'
      - '--destination=finleyma/devops-toolkit:1.0.0'
    volumeMounts:
      - name: kaniko-secret
        mountPath: /kaniko/.docker
  restartPolicy: Never
  volumes:
    - name: kaniko-secret
      secret:
        secretName: regcred
        items:
          - key: .dockerconfigjson
            path: config.json

镜像名称：gcr.io/kaniko-project/executor:debug

注意镜像参数

--context 上下文，可以是仓库地址，压缩包，对象存储地址(S3等)，git仓库，本地路径等。
--destination 目标镜像地址。默认是docker hub，我们还看到它使用了一个secret来获取docker配置文件，然后把它挂载到容器里。

大致流程：

启动 pod，挂载 secret

去github.com/mafeifan/kaniko-demo拉代码，里面有一个Dockerfile，构建镜像。上传到 docker hub，名称为 finleyma/devops-toolkit:1.0.0。

pod退出

3.打开docker hub，确实发现我们的镜像已经创建成功了

https://hub.docker.com/repository/docker/finleyma/devops-toolkit

参考

https://github.com/GoogleContainerTools/kaniko

https://www.youtube.com/watch?v=EgwVQN6GNJg

日志驱动程序

Sat, 13 Dec 2025 02:14:42 GMT

日志驱动程序

默认情况下，捕获的日志显示命令输出是在本地运行容器时在交互式终端上通常看到的内容，即 STDOUT 和 STDERR I/O 流,

Docker 支持的日志驱动

Docker默认支持如下日志驱动。有直接写文件的，有使用云服务的。下面简单介绍下。

https://docs.docker.com/config/containers/logging/configure/

AWS ECS

awslogs 日志驱动程序只是将 Docker 中的这些日志传递到 CloudWatch Logs。这个也是默认的驱动

由于 AWS ECS 底层用到 Docker 技术，所以 Docker 支持的日志驱动也是 ECS 支持的。

For tasks on AWS Fargate, the supported log drivers are awslogs, splunk, and awsfirelens.
For tasks hosted on Amazon EC2 instances, the supported log drivers are awslogs, fluentd, gelf, json-file, journald, logentries,syslog, splunk, and awsfirelens.

json-file - Docker 默认的日志驱动

json-file 是默认的 docker 日志驱动, docker info可以查看

全局的日志驱动设置，可以修改daemon配置文件 /etc/docker/daemon.json。

json

{
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "10m",
    "max-file": "3"
  }
}

写入文件的日志格式长这样：{"log":"java.lang.InterruptedException\n","stream":"stderr","time":"2022-08-14T00:43:00.360028811Z"}，每一行是一个json文件，log字段为容器原来输出的每行内容。

# 查看正在运行的docker
docker ps

# 复制 CONTAINER ID，比如 3b0949ac59d6

dockder logs 3b0949ac59d6

cd /var/lib/docker/containers/3b0949*

tree

root@ip-172-31-30-158:/var/lib/docker/containers/3b0949ac59d63ca27c668fea87a1a1375bae9dde1fa8ee816d2c4961017110c7# tree
.
├── 3b0949ac59d63ca27c668fea87a1a1375bae9dde1fa8ee816d2c4961017110c7-json.log
├── checkpoints
├── config.v2.json
├── hostconfig.json
├── hostname
├── hosts
├── mounts
├── resolv.conf
└── resolv.conf.hash


-json.log 结尾的就是 json 日志文件

怎么记录更多上下文信息

json-file本身是没有记录上下文信息的。集中存储到日志中心服务器，就无法区分具体是哪个应用产生的日志了。

fluentd也有不少通过docker daemon查询或是解析容器目录下config.v2.json获取metadata的 filter 插件。

参考 https://www.fluentd.org/plugins

比如这个 https://github.com/zsoltf/fluent-plugin-docker_metadata_elastic_filter

{
  "log": "2015/05/05 19:54:41 \n",
  "stream": "stderr",
  "docker": {
    "id": "df14e0d5ae4c07284fa636d739c8fc2e6b52bc344658de7d3f08c36a2e804115",
    "name": "k8s_fabric8-console-container.efbd6e64_fabric8-console-controller-9knhj_default_8ae2f621-f360-11e4-8d12-54ee7527188d_7ec9aa3e",
    "container_hostname": "fabric8-console-controller-9knhj",
    "image": "fabric8/hawtio-kubernetes:latest",
    "image_id": "b2bd1a24a68356b2f30128e6e28e672c1ef92df0d9ec01ec0c7faea5d77d2303",
    "labels": {}
  }
}

新增了docker结构体，镜像名称也能收集到了

日志量大了，用docker logs看历史数据不大合适。我们就需要考虑将日志存储到日志中心去。

local

--log-driver指定日志驱动。

cat输出local文件，部分结果乱码。挺不方便日志解析的。

实验

root@ubuntu-parallel:~# docker run --name local_logging_driver --log-driver local hello-world

root@ubuntu-parallel:~# cd /var/lib/docker/containers/$(docker ps --no-trunc -aqf "name=local_logging_driver")

root@ubuntu-parallel:~# cat local-logs/container.log
stdout�������&
stdout�������Hello from Docker!&^
stdout˧�����JThis message shows that your installation appears to be working correctly.^

none

不生成日志文件，docker logs也拿不到日志。实际使用不会考虑

syslog

因为日志被写入了syslog，并混在其他应用的日志中，docker logs没办法工作了。

实验

# 观察syslog
root@ubuntu-parallel:~# tail -f /var/log/syslog

root@ubuntu-parallel:~# docker run --name syslog_logging_driver --log-driver syslog hello-world

# 日志不会写本地
root@ubuntu-parallel:~# cd /var/lib/docker/containers/$(docker ps --no-trunc -aqf "name=syslog_logging_driver")

root@ubuntu-parallel:~# docker logs syslog_logging_driver
Error response from daemon: configured logging driver does not support reading

journald

写入syslog和journald，应用日志与系统日志混在一起，难以辨认了。

倒是journald驱动下，可以使用docker logs。

参考：https://wiki.archlinux.org/index.php/Systemd/Journal

实验

root@ubuntu-parallel:~# docker run --name journald_logging_driver --log-driver journald hello-world

root@ubuntu-parallel:~# journalctl
Apr 02 10:30:36 ubuntu-parallel 4b948bf091a8[999]: To try something more ambitious, you can run an Ubuntu container with:
Apr 02 10:30:36 ubuntu-parallel 4b948bf091a8[999]:  $ docker run -it ubuntu bash
Apr 02 10:30:36 ubuntu-parallel 4b948bf091a8[999]:
Apr 02 10:30:36 ubuntu-parallel 4b948bf091a8[999]: Share images, automate workflows, and more with a free Docker ID:
Apr 02 10:30:36 ubuntu-parallel 4b948bf091a8[999]:  https://hub.docker.com/

root@ubuntu-parallel:~# cd /var/lib/docker/containers/$(docker ps --no-trunc -aqf "name=journald_logging_driver")

# docker logs管用
root@ubuntu-parallel:~# docker logs journald_logging_driver

Fluentd

通过服务请求，让docker吐日志到fluentd进程。https://docs.docker.com/config/containers/logging/fluentd/

使用包括fluentd在很多日志驱动，因为日志写入到远程服务器，会导致docker logs， kubectl logs不可用。

Fluentd是一个挺灵活的工具，可以让fluentd主动监听容器目录下的日志文件。参考另一篇文章 https://xujiahua.github.io/posts/use-fluentd/

比如利用Fluentd将日志打进elasticsearch。

总结

为了兼容可使用docker logs ，kubectl logs，必须使用写本地文件的日志驱动。而json格式更方便工具（比如fluentd，logstash）解析，所以json-file是首选。

然后使用日志收集工具集中采集docker容器日志。k8s中日志收集策略，一般是在每台服务器上以DaemonSet的形式安装logging agent，监听本地文件、文件夹，将日志转发到日志中心。

当然这个前提条件是，应用日志是输出到标准输出和标准错误的。这对应用日志的规范有一定要求：

不输出多行日志。比如panic、exception。
应用日志使用JSON格式输出，方便后续的日志分析。
应用日志中加入更多的上下文信息。用于问题定位，维度分析。
Go应用开发，使用logrus日志库，加字段，以JSON格式输出都很方便。
应用不关注日志该如何收集这个问题。不在应用层写日志到kafka、redis等中间件，让基础设施层处理。
应用要么写入文件、要么写入标准输出，这个应该很方便做成可配置的。对程序来说，都有共同的抽象，io.Writer。
应用日志如果是写到文件的，需要考虑通过数据卷，挂载等将日志与容器分离。采集挂载目录上的日志文件，以前怎么收集，现在还是怎么收集。还是建议写标准输出，这是目前的最佳实践。

参考

https://xujiahua.github.io/posts/20200403-docker-logging/

https://docs.docker.com.zh.xy2401.com/config/containers/logging/configure/

this should start three processes, mysql and ssh

Sat, 13 Dec 2025 02:14:42 GMT

原文: https://support.huaweicloud.com/bestpractice-swr/swr_bestpractice_0002.html

本章基于容器镜像服务实践所编写，将一个单体应用进行容器改造为例，展示如何写出可读性更好的Dockerfile，从而提升镜像构建速度，构建层数更少、体积更小的镜像。

下面是一个常见企业门户网站架构，由一个Web Server和一个数据库组成，Web Server提供Web服务，数据库保存用户数据。通常情况下，这样一个门户网站安装在一台服务器上。

如果把应用运行在一个Docker容器中，那么很可能写出下面这样的Dockerfile来。

dockerfile

FROM ubuntu

ADD . /app

RUN apt-get update  
RUN apt-get upgrade -y  
RUN apt-get install -y nodejs ssh mysql  
RUN cd /app && npm install

# this should start three processes, mysql and ssh
# in the background and node app in foreground
# isn't it beautifully terrible? <3
CMD mysql & sshd & npm start

当然这样Dockerfile有很多问题，这里CMD命令是错误的，只是为了说明问题而写。

下面的内容中将展示对这个Dockerfile进行改造，说明如何写出更好的Dockerfile，共有如下几种处理方法。

一个容器只运行一个进程

从技术角度讲，Docker容器中可以运行多个进程，您可以将数据库、前端、后端、ssh等都运行在同一个Docker容器中。但是，这样跟未使用容器前没有太大区别，且这样容器的构建时间非常长（一处修改就要构建全部），镜像体积大，横向扩展时非常浪费资源（不同的应用需要运行的容器数并不相同）。

通常所说的容器化改造是对应用整体微服务进行架构改造，改造后，再容器化。这样做可以带来如下好处：

单独扩展：拆分为微服务后，可单独增加或缩减每个微服务的实例数量。
提升开发速度：各微服务之间解耦，某个微服务的代码开发不影响其他微服务。
通过隔离确保安全：整体应用中，若存在安全漏洞，一旦被攻击，所有功能的权限都可能会被窃取。微服务架构中，若攻击了某个服务，只可获得该服务的访问权限，无法入侵其他服务。
提升稳定性：如果其中一个微服务崩溃，其他微服务还可以持续正常运行。

因此，上述企业门户网站可以进行如下改造，Web应用和MySQL运行在不同容器中。

MySQL运行在独立的镜像中，这样的好处就是，我们可以对它们分别进行修改，且不会牵一发而动全身。如下面这个例子所示，我们可以删除MySQL，只安装node.js。

dockerfile

FROM ubuntu

ADD . /app

RUN apt-get update  
RUN apt-get upgrade -y

RUN apt-get install -y nodejs 
RUN cd /app && npm install

CMD npm start

不要在构建中升级版本

为了降低复杂性、减少依赖、减小文件大小、节约构建时间，你应该避免安装任何不必要的包。例如，不要在数据库镜像中包含一个文本编辑器。

如果基础镜像中的某个包过时了，但你不知道具体是哪一个包，你应该联系它的维护者。如果你确定某个特定的包，比如foo需要升级，使用apt-get install -y foo就行，该指令会自动升级foo包。

apt-get upgrade会使得镜像构建过程非常不稳定，在构建时不确定哪些包会被安装，此时可能会产生不一致的镜像。因此通常我们会删掉apt-get upgrade。

删掉apt-get upgrade后，Dockerfile如下：

dockerfile

FROM ubuntu

ADD . /app

RUN apt-get update

RUN apt-get install -y nodejs
RUN cd /app && npm install

CMD npm start

将变化频率一样的RUN指令合一

Docker镜像是分层的，类似于洋葱，它们都有很多层，为了修改内层，则需要将外面的层都删掉。Docker镜像有如下特性：

Dockerfile中的每个指令都会创建一个新的镜像层。
镜像层将被缓存和复用。
Dockerfile修改后，复制的文件变化了或者构建镜像时指定的变量不同了，对应的镜像层缓存就会失效。
某一层的镜像缓存失效之后，它之后的镜像层缓存都会失效。
镜像层是不可变的，如果我们在某一层中添加一个文件，然后在下一层中删除它，则镜像中依然会包含该文件，只是这个文件在Docker容器中不可见。

将变化频率一样的指令合并在一起，目的是为了更好的将镜像分层，避免带来不必要的成本。如本例中将node.js安装与npm模块安装放在一起的话，则每次修改源代码，都需要重新安装node.js，这显然不合适。

dockerfile

FROM ubuntu

ADD . /app

RUN apt-get update \  
    && apt-get install -y nodejs \
    && cd /app \
    && npm install

CMD npm start

因此，正确的写法是这样的：

dockerfile

FROM ubuntu

RUN apt-get update && apt-get install -y nodejs  
ADD . /app
RUN cd /app && npm install

CMD npm start

使用特定的标签

当镜像没有指定标签时，将默认使用latest标签。因此，FROM ubuntu指令等同于FROM ubuntu:latest。当镜像更新时，latest标签会指向不同的镜像，这时构建镜像有可能失败。

如下示例中使用16.04作为标签。

dockerfile

FROM ubuntu:16.04

RUN apt-get update && apt-get install -y nodejs  
ADD . /app  
RUN cd /app && npm install

CMD npm start

删除多余文件

假设我们更新了apt-get源，下载解压并安装了一些软件包，它们都保存在/var/lib/apt/lists/目录中。

但是，运行应用时Docker镜像中并不需要这些文件。因此最好将它们删除，因为它会使Docker镜像变大。

示例Dockerfile中，删除/var/lib/apt/lists/目录中的文件。

dockerfile

FROM ubuntu:16.04

RUN apt-get update \  
    && apt-get install -y nodejs \
    && rm -rf /var/lib/apt/lists/*

ADD . /app  
RUN cd /app && npm install

CMD npm start

选择合适的基础镜像

在示例中，我们选择了ubuntu作为基础镜像。但是我们只需要运行node程序，没有必要使用一个通用的基础镜像，node镜像应该是更好的选择。

更好的选择是alpine版本的node镜像。alpine是一个极小化的Linux发行版，只有4MB，这让它非常适合作为基础镜像。

dockerfile

FROM node:7-alpine

ADD . /app  
RUN cd /app && npm install

CMD npm start

设置WORKDIR和CMD

WORKDIR指令可以设置默认目录，也就是运行RUN / CMD / ENTRYPOINT指令的地方。

CMD指令可以设置容器创建时执行的默认命令。另外，您应该将命令写在一个数组中，数组中每个元素为命令的每个单词

dockerfile

FROM node:7-alpine

WORKDIR /app  
ADD . /app  
RUN npm install

CMD ["npm", "start"]

使用ENTRYPOINT（可选）

ENTRYPOINT指令并不是必须的，因为它会增加复杂度。ENTRYPOINT是一个脚本，它会默认执行，并且将指定的命令作为其参数。它通常用于构建可执行的Docker镜像。

dockerfile

FROM node:7-alpine

WORKDIR /app  
ADD . /app  
RUN npm install

ENTRYPOINT ["./entrypoint.sh"]  
CMD ["start"]

ENTRYPOINT脚本中使用exec

在前文的ENTRYPOINT脚本中，使用了exec命令运行node应用。不使用exec的话，我们则不能顺利地关闭容器，因为SIGTERM信号会被bash脚本进程吞没。exec命令启动的进程可以取代脚本进程，因此所有的信号都会正常工作。

优先使用COPY

COPY指令非常简单，仅用于将文件拷贝到镜像中。ADD相对来讲复杂一些，可以用于下载远程文件以及解压压缩包。

dockerfile

FROM node:7-alpine

WORKDIR /app

COPY . /app
RUN npm install

ENTRYPOINT ["./entrypoint.sh"]  
CMD ["start"]

合理调整COPY与RUN的顺序

将变化最少的部分放在Dockerfile的前面，这样可以充分利用镜像缓存。

示例中，源代码会经常变化，则每次构建镜像时都需要重新安装NPM模块，这显然不是我们希望看到的。因此我们可以先拷贝package.json，然后安装NPM模块，最后才拷贝其余的源代码。这样的话，即使源代码变化，也不需要重新安装NPM模块。

dockerfile

FROM node:7-alpine

WORKDIR /app

COPY package.json /app  
RUN npm install  
COPY . /app

ENTRYPOINT ["./entrypoint.sh"]  
CMD ["start"]

设置默认的环境变量、映射端口和数据卷

dockerfile

运行Docker容器时很可能需要一些环境变量。在Dockerfile设置默认的环境变量是一种很好的方式。另外，我们应该在Dockerfile中设置映射端口和数据卷。示例如下：

FROM node:7-alpine

ENV PROJECT_DIR=/app

WORKDIR $PROJECT_DIR

COPY package.json $PROJECT_DIR  
RUN npm install  
COPY . $PROJECT_DIR

ENTRYPOINT ["./entrypoint.sh"]  
CMD ["start"]

ENV指令指定的环境变量在容器中可以使用。如果你只是需要指定构建镜像时的变量，你可以使用ARG指令。

使用VOLUME管理数据卷

VOLUME指令用于暴露任何数据库存储文件、配置文件或容器创建的文件和目录。强烈建议使用VOLUME来管理镜像中的可变部分和用户可以改变的部分。

下面示例中填写一个媒体目录。

dockerfile

FROM node:7-alpine

ENV PROJECT_DIR=/app

WORKDIR $PROJECT_DIR

COPY package.json $PROJECT_DIR  
RUN npm install  
COPY . $PROJECT_DIR

ENV MEDIA_DIR=/media \  
APP_PORT=3000

VOLUME $MEDIA_DIR  
EXPOSE $APP_PORT

ENTRYPOINT ["./entrypoint.sh"]  
CMD ["start"]

使用LABEL设置镜像元数据你可以给镜像添加标签来帮助组织镜像、记录许可信息、辅助自动化构建等。每个标签一行，由LABEL开头加上一个或多个标签对。

WARNING

如果你的字符串中包含空格，必须将字符串放入引号中或者对空格使用转义。如果字符串内容本身就包含引号，必须对引号使用转义。

dockerfile

FROM node:7-alpine  
LABEL com.example.version="0.0.1-beta"

添加HEALTHCHECK

运行容器时，可以指定--restart always选项。这样的话，容器崩溃时，docker daemon会重启容器。对于需要长时间运行的容器，这个选项非常有用。但是，如果容器的确在运行，但是不可用怎么办？使用HEALTHCHECK指令可以让Docker周期性的检查容器的健康状况。我们只需要指定一个命令，如果一切正常的话返回0，否则返回1。当请求失败时，curl --fail命令返回非0状态。示例如下：

dockerfile

FROM node:7-alpine  
LABEL com.example.version="0.0.1-beta"

ENV PROJECT_DIR=/app  
WORKDIR $PROJECT_DIR

COPY package.json $PROJECT_DIR  
RUN npm install  
COPY . $PROJECT_DIR

ENV MEDIA_DIR=/media \  
    APP_PORT=3000

VOLUME $MEDIA_DIR  
EXPOSE $APP_PORT  
HEALTHCHECK CMD curl --fail http://localhost:$APP_PORT || exit 1

ENTRYPOINT ["./entrypoint.sh"]  
CMD ["start"]

编写.dockerignore文件

.dockerignore的作用和语法类似于.gitignore，可以忽略一些不需要的文件，这样可以有效加快镜像构建时间，同时减少Docker镜像的大小。

构建镜像时，Docker需要先准备context，将所有需要的文件收集到进程中。默认的context包含Dockerfile目录中的所有文件，但是实际上，我们并不需要.git目录等内容。

示例如下：

.git/
node_modules

几个有用的文件大小查看命令

Sat, 13 Dec 2025 02:14:42 GMT

几个有用的文件大小查看命令

bash

# 只查看一级目录统计的空间占用
alias dud="du -d 1 -h"

# 查看一级和二级目录的占用
alias du1="du -h --max-depth=1 *"
alias duf="du -sh"

cd /
du -sh * 

31G   var
14G   opt

# 有时候 ISPconfig 开启自动备份，会导致磁盘空间占用过大，请登录 IPSconfig 后台检查
root@jira:/var/backup# du -sh *
1.7G	web10
5.4G	web3
1.7G	web5
784M	web7

清理Docker镜像及日志

默认情况下，docker的日志是在/var/lib/docker/containers//-json.log中

使用sudo docker info 发现日志驱动是Logging Driver: json-file,也应证了此点

有些json.log文件很大，记得清除掉

执行docker images列出本机存在的镜像，最后一列SIZE是镜像大小

强制删除多个镜像 sudo docker rmi --force f439bc73d690 fa440e89e4c2

删除那些已停止的容器、dangling 镜像、未被容器引用的 network 和构建过程中的 cache docker system prune

删除 24 小时前下载的镜像 docker image prune -a --filter "until=24h"

安全起见，这个命令默认不会删除那些未被任何容器引用的数据卷，如果需要同时删除这些数据卷，你需要显式的指定 --volumns 参数。比如你可能想要执行下面的命令： docker system prune --all --force --volumns

清理 Containerd 镜像

k8s 1.24版本后容器运行时从Docker换为了Containerd，所以当你登录到节点后会发现已经没有Docker命令了，换为了 ctr 或 crictl

bash

crictl rmi --prune

使用 ncdu 查看磁盘占用情况

该命令默认会统计当前目录的文件占用情况，并直观的显示出来我现在要查看整个磁盘个目录的占用情况

cd /
ncdu

删除 journal 日志

# 查看磁盘占用
journalctl --disk-usage

# 清理日志
journalctl --vacuum-size=10M

# 只保留一周的日志
journalctl --vacuum-time=1w

删除系统日志文件

cd /var/log
# 删除 /var/log 下的日志压缩包
rm -rf /var/log/*.gz
# 删除 /var/log 轮转日志
rm -rf /var/log/*.1

Sat, 13 Dec 2025 02:14:42 GMT

https://containers.dev/

https://learn.microsoft.com/zh-cn/training/modules/use-docker-container-dev-env-vs-code/3-use-as-development-environment

https://yanbin.blog/rust-language-learning-1/

WEBAPPS WITH DOCKER

Sat, 13 Dec 2025 02:14:42 GMT

来源：https://docker-curriculum.com/ 这篇文章不错，可以作为第一篇 docker 的入门，我简单总结了下。顺便重温下之前的内容。如果你是刚学docker，最好跟着敲一遍。

安装Docker，略过，请自行去官方文档查
执行 docker pull busybox 去官方拉镜像 BusyBox 是一个集成了三百多个最常用Linux命令和工具的软件。简单的说BusyBox就好像是个大工具箱，它集成压缩了 Linux 的许多工具和命令，也包含了 Android 系统的自带的shell。
使用 docker images 查看镜像
创建容器启动 docker run busybox 会看到啥都没有发生，因为没有提供任何命令，容器启动后，运行个空命令就退出了。
如果提供个命令呢 docker run busybox echo "hello from busybox" 这个能看到输出了，但是容器执行完依然退出了。
我想查看正在运行的容器 docker ps 没有任何输出试试 docker ps -a 可以看到刚刚运行过的容器了，注意 status 列

如果想以交互式方式运行容器，并进入容器终端，就用 docker run -it busybox sh 注意 -it 一般是同时出现的

TIP

-t tty的缩写终端控制台
-i interactive 可交互缩写

如果想知道 run 后面都能带什么参数及含义，请使用 docker run --help

一些术语：

Docker Daemon - Docker为C/S架构，服务端为docker daemon，在后台运行，用于管理，构建，分发容器
Docker Client - 就是经常用的命令行工具
Docker Hub - 分享，查找镜像资源的网站

WEBAPPS WITH DOCKER

我们运行一个容器 docker run --rm prakhar1989/static-site
prakhar1989/static-site 是作者维护的镜像 --rm 当退出容器时自动移除 这里容器启动会显示了 nginx is running，但没有告诉更多的信息

按 ctrl+c 退出

使用 docker run -d -P --name static-site prakhar1989/static-site -d 放到后台运行 -P 将容器内应用运行使用的端口暴露出来（ Publish all exposed ports to random ports） --name 给容器起个名字

端口有了，可以打开站点了，还可以使用 docker run -p 8888:80 prakhar1989/static-site 指定端口

同时运行了两个容器

暂停容器用 docker stop static-site static-site 是我们给运行时给容器起的名字，也可以用ID
后面内容是使用 Dockerfile 构建自己的镜像并上传到AWS。由于之前讲过而且aws国内使用不方便，此处略过。
当docker安装后，会自动创建三个网络

bash

$ docker network ls
NETWORK ID          NAME                DRIVER              SCOPE
c2c695315b3a        bridge              bridge              local
a875bec5d6fd        host                host                local
ead0e804a67b        none                null                local

默认使用的是 bridge 桥接。使用 docker network inspect bridge 在 Containers 下面看到正在使用该网络方式的所有容器。默认所有的容器都会使用bridge，通过刚才的命令还可以看到每个容器分配到的内部IP。一般是 172.17.0.xx。为了安全及方便，我们需要使某几个容器之间使用自己的桥接网络，如何做到呢？

使用 docker network 创建一个新的bridge网络，比如 docker network create foodtrucks-net

运行 Elasticsearch 容器并把刚创建的网络分配给他 docker run -d --name es --net foodtrucks-net -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" docker.elastic.co/elasticsearch/elasticsearch:6.3.2
然后运行Python Flask 容器，并进到bash终端 docker run -it --rm --net foodtrucks-net finleyma/foodtrucks-web bash 来测试下能否访问到 Elasticsearch 容器 curl es:9200

TIP

访问容器网络没有输入容器的IP地址，用的容器名称表示，这种能力叫 automatic service discovery，自动服务发现，原理也比较简单 /etc/hosts 里有条记录，es为键名，值就是实际IP，由于IP是动态的，使用名字更不容易出错。

备注：elasticsearch挺占内存的，我服务器4G内存，在docker运行启动后出现了警告

细节

Sat, 13 Dec 2025 02:14:42 GMT

本节通过学习 docker 的 nginx 镜像，容器的使用。以及如何映射文件。

运行容器 docker run --name my-nginx -d -p 8088:80 --rm nginx:1.15

-d：在后台运行
-p：容器的80端口映射到宿主机的 8088 端口
--rm：容器停止运行后，自动删除容器文件
--name：容器的名字为 my-nginx

docker run 其实等于 docker create + start 因为tag为 1.15 的 nginx 镜像并不在本地，会先下载再运行

浏览器打开 locahost:8088 就能看到默认页面了

官方推荐通过 Dockerfile 的方式制作镜像并运行容器

新建static-pages目录，结构如下：

static-pages
   -- index.html
   -- Dockerfile

index.html

<h1>Hello World</h1>

Dockerfile

FROM nginx:1.15
COPY . /usr/share/nginx/html

切换到Dockerfile所在路径

制作镜像 docker build -t my-nginx .，名称为 my-nginx，完整镜像名格式是：name:tag 参见文档

根据镜像运行一个容器 docker run --name my-nginx -d -p 8088:80 my-nginx:latest 浏览器打开 locahost:8088 就能看到 hello-world 了

3.如果要修改nginx配置文件，我们把容器里面的 Nginx 配置文件拷贝到本地的当前目录。执行 docker container cp my-nginx:/etc/nginx . 不要漏掉最后那个点。执行完成后，当前目录应该多出一个nginx子目录。修改Dockerfile

FROM nginx:1.15
COPY index.html /usr/share/nginx/html
COPY nginx /etc/

然后修改 static-pages\nginx\conf.d\default.conf

server {
  listen       80;
  server_name  ng.test;
}

C:\Windows\System32\drivers\etc\HOSTS 需要添加 127.0.0.10 ng.test 保持和localhost一致即可重新制作镜像 docker build -t my-nginx:ng-test . 运行容器 docker run -d -p 80:80 my-nginx:ng-test 注意我映射的端口不再是8088，这样本地浏览器就能访问 ng.test 了

细节

停止容器：先 docker ps 获取容器ID，比如是 934f93002018 然后 docker stop 934f93002018
重启容器docker exec -it kill -USR2 1

define env var default value.

Sat, 13 Dec 2025 02:14:42 GMT

学习技能光看不做是不行的，强烈推荐按照教程敲一遍 https://docs.docker.com/compose/gettingstarted/

Compose项目由 Python 编写，实现上调用了 Docker服务提供的 API 来对容器进行管理。因此只要所操作的平台支持 Docker，就可以在其上利用 Compose 来进行编排管理。

本人提炼出了几点技巧：

多用 docker-compose config 命令校验和查看配置信息，当修改了docker-compose.yml文件，不要急于执行docker-compose up启动，可以先检查下配置。很多时候是yml格式不规范导致的。
docker-compose up 包含了构建镜像，创建服务，启动服务等一系列操作。一般配好文件执行这个命令就可以了。
使用.env环境变量配置文件一些敏感信息如，数据库密码等不建议写死到docker-compose.yml中，可以写在.env环境配置文件中(使用Laravel的同学对这个文件肯定不陌生)。

因为docker-compose.yml一般跟随项目受版本控制，.env可以不受版本控制。

优化前：

docker-compose.yml

yaml

  mysql:
      build: ./docker-build/mysql
      ports:
        - "33060:3306"
      volumes:
        - ./docker-build/mysql/data:/var/lib/mysql
      environment:
        MYSQL_ROOT_PASSWORD: 123456

优化后：

docker-compose.yml
.env

同级目录建立.env文件

yaml

  mysql:
      build: ./docker-build/mysql
      ports:
        - "33060:3306"
      volumes:
        - ./docker-build/mysql/data:/var/lib/mysql
      environment:
       # 先从.env找DOCKER_MYSQL_PASSPORD，找不到使用后面的默认值
        MYSQL_ROOT_PASSWORD: ${DOCKER_MYSQL_PASSPORD-123456}

.env

# define env var default value.
DOCKER_MYSQL_PASSPORD=root

使用docker-compose.yml中的env_file语法

service节点下支持 env_file属性，即环境变量从额外的文件中读取。如下面的例子，如果local.env和common.env有相同key。则下面的优先级高。

yaml

  php:
      build:
        context: ./docker-build/php
        args:
          - INSTALL_COMPOSER=${PHP_INSTALL_COMPOSER}
          - INSTALL_MONGO=${PHP_INSTALL_MONGO}
          - INSTALL_REDIS=${PHP_INSTALL_REDIS}
          - INSTALL_XDEBUG=${PHP_INSTALL_XDEBUG}
      ports:
        - "9001:9000"
      links:
        - "mysql"
      volumes:
        - .:/www
      env_file:
        - ./common.env
        - ./local.env

假设 local.env 中内容是A:1，common.env 是 A:2

yaml

      environment:
        A: 3
      env_file:
        - ./common.env
        - ./local.env

最终生效的是 A:3

配置不同场景下的环境变量我们可以把不同场景下的环境变量定义在不同的 shell 脚本中并导出，然后在执行 docker-compose 命令前先执行 source 命令把 shell 脚本中定义的环境变量导出到当前的 shell 中。通过这样的方式可以减少维护环境变量的地方，下面的例子中我们分别在 docker-compose.yml 文件所在的目录创建 test.sh 和 prod.sh。

test.sh 的内容如下：

bash

#!/bin/bash
# define env var default value.
export IMAGETAG=web:v1
export APPNAME=HelloWorld
export AUTHOR=Nick Li
export VERSION=1.0

prod.sh 的内容如下：

bash

#!/bin/bash
# define env var default value.
export IMAGETAG=webpord:v1
export APPNAME=HelloWorldProd
export AUTHOR=Nick Li
export VERSION=1.0LTS

在测试环境下，执行下面的命令：

bash

$ source test.sh
$ docker-compose config

此时 docker-compose.yml 中的环境变量应用的都是测试环境相关的设置。而在生产环境下，执行下面的命令：

此时 docker-compose.yml 中的环境变量应用的都是生产环境相关的设置。

环境变量的优先级 docker-compose.yml 文件中引用的环境变量，它们的优先级如下：

Compose file
Shell environment variables
Environment file
Dockerfile
Variable is not defined

首先，在 docker-compose.yml 文件中直接设置的值优先级是最高的。然后是在当前 shell 中 export 的环境变量值。接下来是在环境变量文件中定义的值。再接下来是在 Dockerfile 中定义的值。最后还没有找到相关的环境变量就认为该环境变量没有被定义。

额外内容，使用 extends 继承扩展docker-compose.yml 基于其他模板文件进行扩展。例如，我们已经有了一个 webapp 服务，定义一个基础模板文件为 common.yml，如下所示: common.yml:

yaml

webapp
  build : . /webapp 
  environment:
    - DEBUG=false
    - SEND EMAILS=false

再编写一个新的 development .yml 文件，使用 common.yml 中的 webapp 服务进行扩展:

development.yml:

yaml

web:
  extends:
    file: common .yml
    service: webapp 
    ports :
      - "8000:8000" 
    links:
      - db environment:
      - DEBUG=true 
  db:
    image : postgres

后者会自动继承common.yml中的webapp服务及环境变量定义。使用extends需要注意以下两点:

要避免出现循环依赖，例如 A 依赖 B, B 依赖 C, C 反过来依赖 A 的情况。
extends 不会继承 links 和 volumes_from 中定义的容器和数据卷资源。一般情况下，推荐在基础模板中只定义一些可以共享的镜像和环境变量，在扩展模板中具体指定应用变量、链接、数据卷等信息。

TIP

RUN vs CMD vs ENTRYPOINT 的区别

Dockerfile中，在基础镜像上安装软件使用 RUN
CMD命令是当Docker镜像被启动后Docker容器将会默认执行的命令。一个Dockerfile中只能有一个CMD命令。通过执行docker run $image $other_command启动镜像可以重载CMD命令。
使用 docker-compose run 命令可以在服务上运行一次性命令，如 docker-compose run web env 查看服务为web的环境变量

参考：

设置工作目录，下面的RUN命令会在工作目录执行

Sat, 13 Dec 2025 02:14:42 GMT

本节我们自己打包一个docker镜像并发布到官方的镜像仓库中。这样任何人只需执行以下命令： docker run -d -p 3000:3000 finleyma/express 就可以访问一个简单的express程序了。

需要你有简单的express使用经验实现过程非常简单：

本地全局安装 npm install express-generator -g
初始化一个express项目 express myapp
cd myapp，然后 npm run start，项目就在本地运行了。
我们在项目内建立Dockerfile，内容如下：

bash

FROM node:10.8.0-alpine
MAINTAINER www.mafeifan.com
# 设置工作目录，下面的RUN命令会在工作目录执行
WORKDIR /app
# 先拷贝本地的 package.json 和 package-lock 到容器内
# 这样是利用docker的镜像分层机制
COPY package*.json ./
# 安装项目依赖包
# 生产环境可以运行 RUN npm install --only=production 只按照 package.json 中dependencies定义的模块
RUN npm install
# 将根目录下的文件都copy到container（运行此镜像的容器）文件系统的app文件夹下
ADD . /app/
# 暴露容器内的3000端口
EXPOSE 3000
# 容器启动时执行的命令，类似npm run start
CMD ["npm", "start"]

构建镜像 docker build -t finleyma/express . 别忘了最后的点，表示当前目录
启动容器 docker run -d -p 3000:3000 finleyma/express
可选，登录docker hub, 并提交镜像。docker login, docker push finleyma/express
进入容器 docker run -it --rm finleyma/express:1.0 ash 简要说下参数：

-it：这是两个参数，一个是 -i：交互式操作，一个是 -t 终端。我们这里打算进入容器执行一些命令并查看返回结果，因此我们需要交互式终端。
--rm：这个参数是说容器退出后随之将其删除。默认情况下，为了排障需求，退出的容器并不会立即删除，除非手动 docker rm。我们这里只是随便执行个命令，看看结果，不需要排障和保留结果，因此使用 --rm 可以避免浪费空间。
ash：因为我们的Node的基础镜像是10.8.0-alpine， alpine的交互式 Shell是ash不是bash，使用bash会提示not found。注意这个细节。会发现整个项目文件都在容器内。

简单总结使用Docker的好处：

使用版本方便，比如服务器上跑着node6，而你的项目需要node8以上。使用docker因为是隔离环境
部署分享也方便，一行命令完事

问题：容器内的 node_modules 是本来就有还是容器执行 npm install 产生的呢？答案：是构建的时候打包进镜像内了。我们看一下体积，有20M而且进到容器内， ls -l node_modules 时间也是打包的什么，并不是当前时间。

参考：

Sat, 13 Dec 2025 02:14:42 GMT

上一节我们构建了一个Node镜像。这里我有一台已经安装了docker的Linux主机，比如 IP 是154.8.100.124。我只需在主机上执行 docker run -d -p 3000:3000 finleyma/express，就会部署并运行项目然后浏览器中输入154.8.100.100:3000 就可以访问了。这里牵涉到两个问题：

每次修改了项目代码需要重新构建新的镜像，然后push到仓库。
每次还得登录服务器从仓库拉最新的镜像重新运行，这样才能反映出变化。

持续集成就能帮我们做到自动化。不过有几个条件：

需要一个提供持续集成服务的平台，这里我使用国内的 daocloud 他可以接入我们的主机，提供在线 web 的方式管理运行在主机上面的容器。
需要一台能访问的且安装了docker的主机（最好是Linux）。
代码要部署到 github，coding 等 daocloud 支持的代码托管商。

下面介绍下流程：去daocloud绑定仓库，和主机根据仓库构建镜像配置

去 daocloud 申请账号，过程略。
去管理面板添加我们的主机

查看主机上运行的 docker相关的信息在主机上我们得敲 docker info, docker inspect 等。这里直观的多。

添加应用

添加项目，需要绑定 github 或 coding代码源代码源就是上节的express项目，仓库地址是：https://coding.net/u/finley/p/docker-express-demo。里面有Dockerfile。我们让daocloud帮忙构建，并且发布到主机上面。

在流程定义中构建阶段后面添加发布阶段，选择发布到自有主机

这个过程就是push代码之后，daocloud要根据Dockerfile去构建镜像，构建之前可以要运行测试脚本，构建成功之后可能要发送提醒。默认是图形化的配置，也可以切换到yaml形式，编写流程定义 daocloud.yml 文件。这里有个细节，如果你切换到了yaml格式，内容为空。push代码不会触发自动构建的。稍微吐槽下daocloud做的不够人性化，流程定义没有帮助提示。比如匹配分支，满足条件那块，我不知道能填哪些，你弄个问号，鼠标指上去显示几行描述也好啊

这样就实现了，每当本地push代码到仓库，daocloud会重新构建镜像然后发布到主机。

有很多细节没有讲到，请自行查看提供的文档。

参考：

Docker的技术原理介绍

Sat, 13 Dec 2025 02:14:42 GMT

以下内容是网上收集的：自己加了点备注。

Docker的技术原理介绍

Docker就是虚拟化的一种轻量级替代技术。Docker的容器技术不依赖任何语言、框架或系统，可以将App变成一种标准化的、可移植的、自管理的组件，并脱离服务器硬件在任何主流系统中开发、调试和运行。简单的说就是，在 Linux 系统上迅速创建一个容器（类似虚拟机）并在容器上部署和运行应用程序，并通过配置文件可以轻松实现应用程序的自动化安装、部署和升级，非常方便。因为使用了容器，所以可以很方便的把生产环境和开发环境分开，互不影响，这是 docker 最普遍的一个玩法。

Docker相关的核心技术之cgroups

Linux系统中经常有个需求就是希望能限制某个或者某些进程的分配资源。于是就出现了cgroups的概念， cgroup就是controller group ，在这个group中，有分配好的特定比例的cpu时间，IO时间，可用内存大小等。 cgroups是将任意进程进行分组化管理的Linux内核功能。最初由google的工程师提出，后来被整合进Linux内核中。 cgroups中的重要概念是“子系统”，也就是资源控制器，每种子系统就是一个资源的分配器，比如cpu子系统是控制cpu时间分配的。首先挂载子系统，然后才有control group的。比如先挂载memory子系统，然后在 memory子系统中创建一个cgroup节点，在这个节点中，将需要控制的进程id写入，并且将控制的属性写入，这就完成了内存的资源限制。 cgroups 被Linux内核支持，有得天独厚的性能优势，发展势头迅猛。在很多领域可以取代虚拟化技术分割资源。 cgroup默认有诸多资源组，可以限制几乎所有服务器上的资源：cpu mem iops,iobandwide,net,device acess等。

Docker相关的核心技术之LXC

LXC是Linux containers的简称，是一种基于容器的操作系统层级的虚拟化技术。借助于namespace的隔离机制和cgroup限额功能，LXC提供了一套统一的API和工具来建立和管理container。LXC跟其他操作系统层次的虚拟化技术相比，最大的优势在于LXC被整合进内核，不用单独为内核打补丁

LXC 旨在提供一个共享kernel的 OS 级虚拟化方法，在执行时不用重复加载Kernel, 且container的kernel与host 共享，因此可以大大加快 container 的启动过程，并显著减少内存消耗，容器在提供隔离的同时，还通过共享这些资源节省开销，这意味着容器比真正的虚拟化的开销要小得多。在实际测试中，基于LXC的虚拟化方法的IO和 CPU性能几乎接近 baremetal 的性能。

备注：最初实现是基于 LXC，从 0.7 版本以后开始去除 LXC，转而使用自行开发的 libcontainer，从 1.11 开始，则进一步演进为使用 runC 和 containerd。

虽然容器所使用的这种类型的隔离总的来说非常强大，然而是不是像运行在hypervisor上的虚拟机那么强壮仍具有争议性。如果内核停止，那么所有的容器就会停止运行。 • 性能方面：LXC>>KVM>>XEN • 内存利用率：LXC>>KVM>>XEN • 隔离程度： XEN>>KVM>>LXC

备注：XEN，KVM有些同学对这个名词不会陌生，所谓虚拟主机，就是采用了这个技术，在一台物理主机上面，采用这种技术再划分N多台虚拟主机去售卖。可以搜下KVM或XEN虚拟主机。

Docker相关的核心技术之AUFS

什么是AUFS? AuFS是一个能透明覆盖一或多个现有文件系统的层状文件系统。支持将不同目录挂载到同一个虚拟文件系统下，可以把不同的目录联合在一起，组成一个单一的目录。这种是一种虚拟的文件系统，文件系统不用格式化，直接挂载即可。 Docker 一直在用 AuFS 作为容器的文件系统(注意：目前好像不是这样的)。当一个进程需要修改一个文件时，AuFS 创建该文件的一个副本。 AuFS 可以把多层合并成文件系统的单层表示。这个过程称为写入复制（ copy on write ）。 AuFS 允许Docker把某些镜像作为容器的基础。例如，你可能有一个可以作为很多不同容器的基础的CentOS 系统镜像。多亏 AuFS，只要一个CentOS镜像的副本就够了，这样既节省了存储和内存，也保证更快速的容器部署。使用AuFS的另一个好处是Docker的版本容器镜像能力。每个新版本都是一个与之前版本的简单差异改动，有效地保持镜像文件最小化。但，这也意味着你总是要有一个记录该容器从一个版本到另一个版本改动的审计跟踪。

Docker原理之App打包

LXC的基础上, Docker额外提供的Feature包括：标准统一的打包部署运行方案。为了最大化重用Image，加快运行速度，减少内存和磁盘footprint, Docker container运行时所构造的运行环境，实际上是由具有依赖关系的多个Layer组成的。例如一个apache的运行环境可能是在基础的rootfs image的基础上，叠加了包含例如Emacs等各种工具的image，再叠加包含apache及其相关依赖library的image，这些image由AUFS文件系统加载合并到统一路径中，以只读的方式存在，最后再叠加加载一层可写的空白的Layer用作记录对当前运行环境所作的修改。有了层级化的Image做基础，理想中，不同的APP就可以既可能的共用底层文件系统，相关依赖工具等，同一个APP的不同实例也可以实现共用绝大多数数据，进而以copy on write的形式维护自己的那一份修改过的数据等。

备注：简单说Docker是基于Linux的虚拟化技术，又加入了image，Dockerfile等概念。又整了个类似github的docker hub。等发展起来了自己的生态系统。Docker本身提供的命令非常简单，Dockerfile，Docker compose又便于学习及运用，这是Docker火起来的一大原因。

Docker和传统虚拟化方式的不同之处

传统虚拟机技术是虚拟出一套硬件后，在其上运行一个完整操作系统，在该系统上再运行所需应用进程；而容器内的应用进程直接运行于宿主的内核，容器内没有自己的内核，而且也没有进行硬件虚拟。因此容器要比传统虚拟机更为轻便。

参考：https://yeasy.gitbook.io/docker_practice/underly

在线书籍

Sat, 13 Dec 2025 02:14:42 GMT

在线书籍

Docker —— 从入门到实践

部署私有仓库

https://docs.docker.com/registry/deploying/
https://github.com/goharbor/harbor
https://docs.docker.com/develop/develop-images/dockerfile_best-practices/
Awesome Docker系列
Awesome Compose) 收集的一些常见的语言框架的docker-compose示例
Docker Cheat Sheet Docker速查表

Docker开源公共镜像提供商

推荐几个好用的 Docker 开源公共镜像提供商，还可以学习他们打包镜像的思路

Bitnami，提供wordpress, Laravel, Magento, Sonarqube, Redmine，Joomla 等镜像。
CircleCI images CircleCI 本身提供的是CI/CD服务。针对不同语言和工具，自己维护了一些常用的镜像。

而且所有镜像都预装了常用工具，如git, gzip, unzip, sudo, wget, zip 等。

thecodingmachine/docker-images-php 提供了很多PHP相关的镜像
鼎鼎有名的JetBrains公司维护的PHP相关镜像 https://github.com/JetBrains/phpstorm-docker-images
提供支持很多Laravel版本的PHP+nginx镜像 https://github.com/dwchiang/nginx-php-fpm
亚马逊的公有镜像仓库,速度还不错

为什么使用单进程容器

Sat, 13 Dec 2025 02:14:42 GMT

为什么使用单进程容器

使用容器时，要尽量使用单进程容器，所谓单进程容器，是指在容器运行时，只有一个工作进程。

如果需要存在多个进程协作的时候，要部署为两个容器，比如 PHP 一个容器，MySQL 一个容器，而不要在一个容器中运行这两者。

因为，Docker本身就是一个非常好的守护进程，它可以完美地管理一个进程，但是如果一个容器中存在多个进程时，你就需要自己维护两个进程的运行状态，比如使用 supervisord ，但这就大大增加了容器维护的难度和不稳定性。

比如在一个容器中同时运行 PHP 和 MySQL，那么如果PHP异常退出了，容器该不该连同MySQL一起退出？如果不退出，而是不断重启PHP，那么在容器之外，比如运行 docker ps 是无法了解到PHP运行状态的。

所以，使用docker，就要习惯于单进程容器的方式，既简单，又稳健。

为什么使用无状态容器

所谓状态，是指程序在执行过程中生成的中间数据，而无状态容器，是指容器在运行时，不在容器中保存任何数据，而将数据统一保存在容器外部，比如数据库中。

因为有状态的容器异常重启就会造成数据丢失，也无法多副本部署，无法实现负载均衡。

比如PHP的Session数据默认存储在磁盘上，比如 /tmp 目录，而多副本负载均衡时，多个PHP容器的目录是彼此隔离的。比如存在两个副本A和B，用户第一次请求时候，流量被转发到A，并生成了SESSION，而第二次请求时，流量可能被负载均衡器转发到B上，而B是没有SESSION数据的，所以就会造成会话超时等BUG。

如果采用主机卷的方式，多个容器挂载同一个主机目录，就可以共享SESSION数据，但是如果多主机负载均衡场景，就需要将SESSION存储于外部数据库或Redis中了。

除了文件，还有内存数据，比如Node.js项目中使用了全局变量暂存数据，那么这个容器也是有状态的，也会出现类似BUG，所以要使用无状态容器。

为什么要避免使用latest

docker镜像的tag部分可以省略，默认为latest，比如： docker pull ubuntu

这当然非常方便，但是请不要这样操作。在部署镜像时或Dockerfile的FROM中，请不要省略Tag，也不要使用latest作为Tag。

首先，这样非常不直观，ubuntu:16.04 要比 ubuntu:latest 更加明确，使用 latest 作为标签时，我们经常需要进行思考甚至查阅仓库文档才能确定具体的版本号。

更重要的，latest 引用是经常变化的，随着时间的推移，此时的latest可能和下个月的latest是完全不同的版本，比如 ubuntu:latest 刚刚从 16.04 升级为 18.04，使用 latest 会给未来增加非常多的不确定性隐患，此时能部署成功，下个月也许就会出现各种问题。

所以，请一定避免使用latest标签，而使用稳定的、明确的、具体的版本号来标明你的依赖项。

RUN cd

WORKDIR 指定工作目录（或称当前目录），以后各层的当前目录就被改为指定的目录，如该目录不存在，WORKDIR 会自行创建。 WORKDIR 在 Dockerfile可以多次使用

WARNING

Dockerfile 不能等同于 Shell 脚本来书写，下面是错误写法：

RUN cd /app
RUN echo "hello" > world.txt

此 Dockerfile 构建镜像，会发现找不到 /app/world.txt 文件，或者其内容不是 hello 。

在 Shell 中，连续两行是同一个进程执行环境，因此前一个命令修改的内存状态，会直接影响后一个命令；

而在 Dockerfile 中，这两行 RUN 命令的执行环境根本不同，是两个完全不同的容器。

每一个 RUN 都会启动一个容器、执行命令、然后提交存储层文件变更。

第一层 RUN cd /app 的执行仅仅是当前进程的工作目录变更，一个内存上的变化而已，其结果不会造成任何文件变更。

第二层启动的是一个全新的容器，跟第一层的容器更完全没关系，自然不可能继承前一层构建过程中的内存变化。

因此如果需要改变以后各层的工作目录的位置，那么应该使用 WORKDIR 指令。

Sat, 13 Dec 2025 02:14:42 GMT

Docker容器的数据管理

Sat, 13 Dec 2025 02:14:42 GMT

Docker容器的数据管理

在使用Docker的过程中，必然会涉及到容器的数据管理操作，例如查看容器内应用生成或更新的数据，容器内数据的备份／恢复，容器之间进行数据共享等操作。Docker中数据管理等方式主要有两种：

数据卷(Data volumes)
数据卷容器(Data volume containers)

数据卷和数据卷容器

数据卷是一个供容器使用的特殊目录，用来存放持久化或共享数据的地方，而数据卷容器其实就是一个普通容器，只是这个容器专门提供数据卷给其它容器挂载使用，因此，数据卷和数据卷容器之间有着密切的联系，并不是两个完全不相关的概念。

当使用docker run或者docker create命令时，使用-v就可以在容器内创建一个数据卷，默认情况下，Docker Engine会在宿主机上的/var/lib/docker/volumes/目录下创建一个特殊目录，供容器挂载使用，而挂载了这个数据卷的容器便可以称为数据卷容器。我们将这种方式，称为在容器里创建一个数据卷，此外，我们还可以指定挂载一个宿主机的本地目录到容器中作为数据卷。

如上图所示，volume container1分别挂载了容器内创建的数据卷/vol1以及指定挂载了一个宿主机中的本地目录作为数据卷/vol2。而volume container2则只挂载了数据卷/vol2。通过这样，当我们修改Docker默认数据目录以及修改挂载的本地宿主机目录时，数据卷容器中挂载的数据卷/vol1和数据卷vol2中的数据也都会进行变更，反之亦然。

除了上述创建数据卷的方式外，我们还可以使用--volume-from的方式，指定数据卷容器，从而挂载其中的数据卷。还是上图中，containerA和containerB在使用docker run创建容器时，通过--volume-from选项指定直接使用volume container2中的数据卷/vol2。

数据卷的特性

通过前面所述，我们理解了什么是数据卷和数据卷容器，接下来，简要总结数据卷的特性：

当我们在创建容器时，数据卷就会自动初始化。
数据卷可以在容器之间共享和复用。
对数据卷的数据的更新，不会影响到镜像。
对数据卷的修改会立刻生效。
数据卷中的数据会一直存在，直到删除最后一个挂载该数据卷的容器被删除时，还需要显示指定删除关联的数据卷。

通过Docker提供的数据卷和数据卷容器的特性和机制，我们可以对容器内的数据进行共享、备份和恢复，增加了容器的容灾能力。即使容器在运行过程中发生故障也不用担心，只需要快速重新创建容器，挂载数据卷即可。当然，在实际生产环境中，还是需要配合支持诸如RAID、DRBD、以及ceph和HDFS等分布式存储技术来的达到数据的安全性和高可用性。

https://docs.docker.com/storage/volumes/

参考

Sat, 13 Dec 2025 02:14:42 GMT

原文：https://docs.docker.com/ci-cd/github-actions/

可以直接fork这个项目练习这里假设你已有docker hub账号，先登录，进到https://hub.docker.com/settings/security生成access token，注意好记好。然后打开Github到Settings > Secrets > New secret添加两条记录：

键名：DOCKER_HUB_USERNAME，值是Docker hub的用户名
键名：DOCKER_HUB_ACCESS_TOKEN，值是刚才复制的access token，值类似c292155d-1bd7-xxxx-xxxx-4da75bedb178

关于参见 buildx 修改.github/workflows/main.yml文件

yaml

name: CI to Docker Hub 

on:
  push:
        branches: [ master ]
   # tags:
   #   - "v*.*.*"

jobs:

  build:
    runs-on: ubuntu-latest
    steps:
      -
        name: Set up Docker Buildx
        uses: docker/setup-buildx-action@v1
      -
        name: Login to DockerHub
        uses: docker/login-action@v1 
        with:
          username: ${{ secrets.DOCKER_HUB_USERNAME }}
          password: ${{ secrets.DOCKER_HUB_ACCESS_TOKEN }}
      -
        name: Build and push
        id: docker_build
        uses: docker/build-push-action@v2
        with:
          push: true
          tags: finleyma/simplewhale:latest
          build-args: |
            arg1=value1
            arg2=value2
      -
        name: Image digest
        run: echo ${{ steps.docker_build.outputs.digest }}

参考

main.yml

Sat, 13 Dec 2025 02:14:42 GMT

yaml

# main.yml

# Workflow's name
name: Build Electron App For Win/Mac

# Workflow's trigger
on:
  push:
    tags:
      - "v*.*.*"

# Workflow's jobs
jobs:
  # job's id
  release:
    # job's name
    name: build and release electron app

    # the type of machine to run the job on
    runs-on: ${{ matrix.os }}

    # create a build matrix for jobs
    strategy:
      fail-fast: false
      matrix:
        os: [windows-2019, macos-10.15]

    # create steps
    steps:
      # step1: check out repository
      - name: Check out git repository
        uses: actions/checkout@v2

      # step2: install node env
      - name: Install Node.js
        uses: actions/setup-node@v2-beta

      # step3: npm install
      - name: npm install
        run: |
          npm install

      # step4: build app for mac/win
      - name: build windows app
        if: matrix.os == 'windows-2019'
        run: |
          npm run electron:build-win
        env:
          GH_TOKEN: bef0b46667d2b13f8asdasdasd762873af59f71c

      - name: build mac app
        if: matrix.os == 'macos-10.15'
        run: |
          npm run electron:build
        env:
          GH_TOKEN: bef0b46667d2b13f8asdasdasd762873af59f71c

      # step5: cleanup artifacts in dist_electron
      - name: cleanup artifacts for windows
        if: matrix.os == 'windows-2019'
        run: |
          npx rimraf "dist_electron/!(*.exe)"

      - name: cleanup artifacts for macosZ
        if: matrix.os == 'macos-10.15'
        run: |
          npx rimraf "dist_electron/!(*.dmg)"

      # step6: upload artifacts
      - name: upload artifacts
        uses: actions/upload-artifact@v2
        with:
          name: ${{ matrix.os }}
          path: dist_electron

      # step7: create release
      - name: release
        uses: softprops/action-gh-release@v1
        if: startsWith(github.ref, 'refs/tags/')
        with:
          files: "dist_electron/**"
        env:
          GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}

Sat, 13 Dec 2025 02:14:42 GMT

https://docs.github.com/en/free-pro-team@latest/actions/reference/context-and-expression-syntax-for-github-actions

Sat, 13 Dec 2025 02:14:42 GMT

每次修改后推送源码，GitHub Actions 都会自动运行，那怎么知道运行的结果呢，GitHub Actions 为我们提供了徽标图标，可以加入到你的项目主页中，图标地址语法如下：

https://github.com///workflows//badge.svg?branch=

：所有者的用户名
：项目仓库名称
：工作流名称
：分支名称，如果不写默认是master分支

本项目的图标地址就是：https://github.com/mafeifan/vue-press/workflows/CI/badge.svg

https://github.com/mafeifan/vue-press/workflows/CI/badge.svg

为什么选择 GitHub Actions

Sat, 13 Dec 2025 02:14:42 GMT

为什么选择 GitHub Actions

开箱即用的环境。从 GitHub 官方的虚拟环境仓库可以看到，Ubuntu 20.04 的环境中自带了 Java 11，Kotlin 1.6.0，Gradle 7.3，和 Android SDK 的常用版本。相比上面的传统方法，Ubuntu 这套环境其实已经解决了很多编译环境问题了，且合适大部分的 Android 项目的构建，如果遇到不满足的地方，下面也有方法告诉你怎么轻易地解决。

足够的免费配额。GitHub Actions 对于免费的账户也是有一定的限制的，具体表现在：每个仓库的构建产物限制是 500MB，每个月的运行时长是 2000 分钟。对于我们只是构建一个普通的 Android 项目安装包来说，也够用了，运行时长也是绰绰有余。

如何使用 GitHub Actions

下面就通过实战来看看如何方便快捷地用 GitHub Actions 来构建一个开源 Android 项目的 APK 安装包吧。我这里选择的是 FolioReader，一个 Java 编写的 ePub 阅读器，在 GitHub 上开源并获得 2k ⭐。

这里是我编写的 GitHub Actions 运行的配置文件并开源在 Wsine/android_builder，我会详细地说明一下每个步骤都做了什么。

yaml

name: android_build

on:
  workflow_dispatch:

jobs:
  build:
    runs-on: ubuntu-latest
    steps:
      - name: Checkout the code
        # 拉取 android_builder 的源代码
        uses: actions/checkout@v2
      - name: Set up JDK
        # 设置 Java 运行环境
        uses: actions/setup-java@v1
        with:
          java-version: 1.8
          # 用 1.8 版本覆盖环境中自带的 Java 11 版本
      - id: get-project
        # 读取项目地址
        name: Get project name
        run: echo "::set-output name=PROJECT::$(cat project-to-build)"
      - name: Clone project
        # 拉取项目源码到虚拟环境
        run: git clone --depth=1 ${{ steps.get-project.outputs.PROJECT }} project
      - name: Build the app
        # 构建调试版 APK
        working-directory: ./project
        run: |
          if [ ! -f "gradlew" ]; then gradle wrapper; fi
          chmod +x gradlew
          ./gradlew assembleDebug --stacktrace
      - name: Upload APK
        # 打包上传生成的 APK 到的网页端
        uses: actions/upload-artifact@v2
        with:
          name: my-build-apk
          path: ./**/*.apk

这个 Workflow 的触发条件设置为手动触发，因为还需要一些修改才能满足目标 Android 项目的构建条件，因此没有设置为常规的基于文件改动就触发。

虚拟环境这里我使用的是 ubuntu-latest，在此时就是指向 Ubuntu 20.04 这个 LTS 版本，日常开发中可能不建议使用这种不确定的版本，但在我们的场景中还是毕竟合适的，因为一个还在维护的 Android 项目一般都会适配较新的 LTS 版本的。

第一步是拉取 android_builder 的源代码，主要目的是获取 project-to-build 这份文件，里面包含了我们的目标 Android 项目的 GitHub 地址。在我们这个实战中就是 https://github.com/FolioReader/FolioReader-Android 这个地址，如需编译其它的项目，把该地址替换为其相应的 GitHub 地址即可。

第二步是设置运行环境，这里是重点。一般情况下，Android 项目中的 Java 代码语法需要一定的 Java 编译器版本，因此我这里引入了 actions/setup-java 这个 action 来快捷地设置 Java 的版本，比如这里我使用了 1.8 版本（Java 8）覆盖环境中自带的 Java 11 版本。同样地，设置 Gradle 和 Android SDK 也有快捷的 action 可以复用，分别为 gradle/gradle-build-action 和 android-actions/setup-android。GitHub 官方的 Ubuntu 20.04 的环境中自带的版本已经是比较高的版本了，一般情况下程序都有后向兼容，所以大部分的情况下你其实可以完全不用设置。这里仅是一个例子来展示如何轻松地修改版本。

第三步的目标是从 project-to-build 这份文件中读取 Android 项目的开源地址并传递给下一步进行拉取Android 项目源码。注意，目标 Android 项目要开源并且是处于公开的状态。cat project-to-build可以读取这份文件包含的地址，然后通过 GitHub Actions 中特殊的语法 ::set-output name=PROJECT::XXX设置地址为该步骤的输出。

第四步是拉取目标 Android 项目源码到虚拟环境中准备编译。首先通过

${{ steps.get-project.outputs.PROJECT }}

获取上一步的输出地址，然后用 Git 命令克隆 Android 项目源码到虚拟环境的本地中。至此，编译前的准备工作已完成。

第五步是构建 APK 的关键步骤，这里假设目标 Android 项目是已经能够编译通过的了。gradlew 是 Gradle 包管理工具自己产生的一个 bash 脚本，用于命令行环境下的自动构建，绝大部分的开源项目已经包含了该文件，因此我加了个判断，如果不存在该文件则用 Gradle 生成出来，并赋予执行权限。得益于优秀的包管理器，Android 项目下只需要一句命令即可构建出 APK 安装包——./gradlew assembleDebug --stacktrace，该命令用于构建调试版 APK，调试版本已满足个人的使用，折腾应用签名就没有必要了。后面的 stacktrace 参数只是为了显示更多的运行信息。执行完这步， APK 就已经生成好了。

最后一步，把生成的 APK 文件打包上传到 GitHub Actions 的网页端，方便下载。你也可以上这里看看我构建的 APK 输出，最后会得到一个 zip 压缩包，包含了最终生成的 APK 文件。

整个构建过程只需要 2m 47s，就得到了我们的 APK 文件，其中包含了下载全部依赖库和从零开始编译两个过程，相比自己下载到本地编译从运行速度和网速两个角度来说，整个过程就显得非常快了。然后就可以把 APK 文件传输到自己的手机，在设置中打开「允许安装未知来源应用」的选项，就能够顺利安装到手机中。

如何复刻该 Workflow

首先 fork 一下 Wsine/android_builder 这个仓库，根据上面第三步的操作，修改 project-to-build 这个文件改为你需要编译的 Android 项目的 GitHub 地址，然后如下图所示点击，即可运行该 Workflow。运行完毕后点开 Workflow 在 Summary 的选项卡中找到 Artifacts，即可下载带 APK 的压缩包。

感谢 GitHub Actions 让以往相对复杂、也有不低上手门槛的事情变得更加简单、快捷，如果你也有过类似的需求，不妨现在就找个项目上手试试吧。

参考

https://sspai.com/post/70427

Sat, 13 Dec 2025 02:14:42 GMT

https://www.jonathan-wilkinson.com/github-actions-cache-everything

https://github.com/actions/cache/blob/main/README.md

https://docs.github.com/en/free-pro-team@latest/actions/guides/caching-dependencies-to-speed-up-workflows

Github Action 是什么？

Sat, 13 Dec 2025 02:14:42 GMT

请配合官方文档，虽然翻译的不全。官方的永远的最新的。

Github Action 是什么？

是 Github 推出的持续集成工具

持续集成是什么？

简单说就是自动化的打包程序——如果是前端程序员，这样解释比较顺畅：

每次提交代码到 Github 的仓库后，Github 都会自动创建一个虚拟机（Mac / Windows / Linux 任我们选），来执行一段或多段指令（由我们定），例如：

npm install npm run build

关于虚拟机的目前是 Microsoft Azure 提供的Standard_DS2型号，硬件配置是2核7G内存，14G的SSD硬盘，详见

Yaml 是什么？

我们集成 Github Action 的做法，就是在我们仓库的根目录下，创建一个 .github 文件夹，里面放一个 *.yaml 文件——这个 Yaml 文件就是我们配置 Github Action 所用的文件。

它是一个非常容易地脚本语言，如果我们不会的话，也没啥大事继续往下看就成了。

参考文档：五分钟学习 YAML

Github Action 的使用限制

每个 Workflow 中的 job 最多可以执行 6 个小时每个 Workflow 最多可以执行 72 小时每个 Workflow 中的 job 最多可以排队 24 小时在一个存储库的所有 Action 中，一个小时最多可以执行 1000 个 API 请求并发工作数：Linux：20，Mac：5（专业版可以最多提高到 180 / 50）

什么是 Workflow？

Workflow 是由一个或多个 job 组成的可配置的自动化过程。我们通过创建 YAML 文件来创建 Workflow 配置。

一、如何定义 Workflow 的名字？

name

Workflow 的名称，Github 在存储库的 Action 页面上显示 Workflow 的名称。

如果我们省略 name，则 Github 会将其设置为相对于存储库根目录的工作流文件路径。

name: Greeting from Mona on: push

二、如何定义 Workflow 的触发器？

on

触发 Workflow 执行的 event 名称，比如：每当我提交代码到 Github 上的时候，或者是每当我打 TAG 的时候。

yaml

// 单个事件
on: push

// 多个事件
on: [push,pull_request]

三、Workflow 的 job 是什么？

答：一个 Workflow 由一个或多个 jobs 构成，含义是一次持续集成的运行，可以完成多个任务。

1、如何定义一个 job？

yaml

jobs:
  my_first_job:
    name: My first job
  my_second_job:
    name: My second job

答：通过 job 的 id 定义。

每个 job 必须具有一个 id 与之关联。

上面的 my_first_job 和 my_second_job 就是 job_id。

2、如何定义 job 的名称？

jobs..name

name 会显示在 Github 上

3、如何定义 job 的依赖？job 是否可以依赖于别的 job 的输出结果？

jobs..needs

答：needs 可以标识 job 是否依赖于别的 job——如果 job 失败，则会跳过所有需要该 job 的 job

yaml

jobs:
  job1:
  job2:
    needs: job1
  job3:
    needs: [job1, job2]

jobs..outputs：用于和 need 打配合，outputs 输出=》need 输入

yaml

jobs:
  job1:
    runs-on: ubuntu-latest
    # Map a step output to a job output
    outputs:
      output1: ${{ steps.step1.outputs.test }}
      output2: ${{ steps.step2.outputs.test }}
    steps:
    - id: step1
      run: echo "::set-output name=test::hello"
    - id: step2
      run: echo "::set-output name=test::world"
  job2:
    runs-on: ubuntu-latest
    needs: job1
    steps:
    - run: echo ${{needs.job1.outputs.output1}} ${{needs.job1.outputs.output2}}

4、如何定义 job 的运行环境？

jobs..runs-on

指定运行 job 的运行环境，Github 上可用的运行器为：

windows-2019
ubuntu-20.04
ubuntu-18.04
ubuntu-16.04
macos-10.15

而且这些操作系统上面已经预装了一些常用的软件开发工具，如Ubuntu 20.04.1 LTS安装的软件

yaml

jobs:
   job1:
     runs-on: macos-10.15
   job2:
     runs-on: windows-2019

5、如何给 job 定义环境变量？

jobs..env

yaml

jobs:
  job1:
    env:
      FIRST_NAME: Mona

6、如何使用 job 的条件控制语句？

jobs..if

我们可以使用 if 条件语句来组织 job 运行

四、Step 属性是什么？

答：每个 job 由多个 step 构成，它会从上至下依次执行。

step 运行的是什么？ step 可以运行：

commands：命令行命令 setup tasks：环境配置命令（比如安装个 Node 环境、安装个 Python 环境） action（in your repository, in public repository, in Docker registry）：一段 action（Action 是什么我们后面再说）每个 step 都在自己的运行器环境中运行，并且可以访问工作空间和文件系统。

因为每个 step 都在运行器环境中独立运行，所以 step 之间不会保留对环境变量的更改。

yaml

# 定义 Workflow 的名字
name: Greeting from Mona

# 定义 Workflow 的触发器
on: push

# 定义 Workflow 的 job
jobs:
  # 定义 job 的 id
  my-job:
    # 定义 job 的 name
    name: My Job
    # 定义 job 的运行环境
    runs-on: ubuntu-latest
    # 定义 job 的运行步骤
    steps:
    # 定义 step 的名称
    - name: Print a greeting
      # 定义 step 的环境变量
      env:
        MY_VAR: Hi there! My name is
        FIRST_NAME: Mona
        MIDDLE_NAME: The
        LAST_NAME: Octocat
      # 运行指令：输出环境变量
      run: |
        echo $MY_VAR $FIRST_NAME $MIDDLE_NAME $LAST_NAME.

五、Action 是什么？

我们可以直接打开的 Action 市场来看看 Action 其实就是命令，比如 Github 官方给了我们一些默认的命令：比如最常用的，check-out 代码到 Workflow 工作区: https://github.com/marketplace/actions/checkout

1、我们应该如何使用 Action？

jobs..steps.uses

比如我们可以 check-out 仓库中最新的代码到 Workflow 的工作区：

yaml

steps:
  - uses: actions/checkout@v2

当然，我们还可以给它添加个名字：

yaml

steps:
  - name: Check out Git repository
    uses: actions/checkout@v2

再比如说，我们如果是 node 项目，我们可以安装 Node.js 与 NPM：

yaml

steps:
- uses: actions/checkout@v2
- uses: actions/setup-node@v2-beta
  with:
    node-version: '12'

2、上面我们为什么要用：@v2 和 @v2-beta 呢？

答：首先，正如大家所想，这个 @v2 和 @v2-beta 的意思都是 Action 的版本。

我们如果不带版本号的话，其实就是默认使用最新版本的了。

但是 Github 官方强烈要求我们带上版本号——这样子的话，我们就不会出现：写好一个 Workflow，但是由于某个 Action 的作者一更新，我们的 Workflow 就崩了的问题

3、上面的 with 参数是什么意思？

答：有的 Action 可能会需要我们传入一些特定的值：比如上面的 node 版本啊之类的，这些需要我们传入的参数由 with 关键字来引入。

具体的 Action 需要传入哪些参数，还请去 Github Action Market 中 Action 的页面中查看。

具体库的使用和参数，我们可以去官方的 Action 市场查看：

六、我们如何运行命令行命令？

jobs..steps.run

上文说到，steps 可以运行：action 和 command-line programs。

我们现在已经知道可以使用 uses 来运行 action 了，那么我们该如何运行 command-line programs 呢？

答案是：run

run 命令在默认状态下会启动一个没有登录的 shell 来作为命令输入器。

1、如何运行多行命令？

每个 run 命令都会启动一个新的 shell，所以我们执行多行连续命令的时候需要写在同一个 run 下：

yaml

单行命令
- name: Install Dependencies
  run: npm install
多行命令
- name: Clean install dependencies and build
  run： |
    npm ci
    npm run build

2、如何指定 command 运行的位置？

使用 working-directory 关键字，我们可以指定 command 的运行位置：

yaml

- name: Clean temp directory
  run: rm -rf *
  working-directory: ./temp

3、如何指定 shell 的类型？（使用 cmd or powershell or python？？）

使用 shell 关键字，来指定特定的 shell：

yaml

steps:
  - name: Display the path
    run: echo $PATH
    shell: bash

各个系统支持的 shell 类型

七、什么是矩阵？

答：就是有时候，我们的代码可能编译环境有多个。比如 electron 的程序，我们需要在 macos 上编译 dmg 压缩包，在 windows 上编译 exe 可执行文件。

这种时候，我们使用矩阵就可以啦~

比如下面的代码，我们使用了矩阵指定了：2 个操作系统，3 个 node 版本。

这时候下面这段代码就会执行 6 次—— 2 x 3 = 6！！！

yaml

runs-on: ${{ matrix.os }}
strategy:
  matrix:
    os: [ubuntu-16.04, ubuntu-18.04]
    node: [6, 8, 10]
steps:
  - uses: actions/setup-node@v1
    with:
      node-version: ${{ matrix.node }}

八、跳过Github Actions

在 commit 信息中只要包含了下面几个关键词就会跳过 CI，不会触发 CI Build

[skip ci]
[ci skip]
[no ci]
[skip actions]
[actions skip]

参考

Github Action 精华指南

Sat, 13 Dec 2025 02:14:42 GMT

https://www.jonathan-wilkinson.com/github-actions-cache-everything

https://github.com/actions/cache/blob/main/README.md

https://docs.github.com/en/free-pro-team@latest/actions/guides/caching-dependencies-to-speed-up-workflows

Sat, 13 Dec 2025 02:14:42 GMT

需求：不想每次提交都触发Github Actions构建，只有git commit message不包含指定的内容才触发

Github Actions 支持 jobs..if 语法 Github Actions运行中我们可以拿到一些当前的环境信息，比如git的提交内容信息，通过这些内容来控制actions的执行

比如，当git message不包含wip才触发构建

yaml

jobs:
  format:
    runs-on: ubuntu-latest
    if: "! contains(github.event.head_commit.message, 'wip')"

同理，下面的workflow表示，只有git message中包含[build]才触发构建，否则跳过

yaml

jobs:
  format:
    runs-on: ubuntu-latest
    if: "contains(github.event.head_commit.message, '[build]')"

具体的信息我们可以全部打印出来，修改workflow文件,添加steps

yaml

on: push

jobs:
  one:
    runs-on: ubuntu-latest
    steps:
      - name: Dump GitHub context
        env:
          GITHUB_CONTEXT: ${{ toJson(github) }}
        run: echo "$GITHUB_CONTEXT"
      - name: Dump job context
        env:
          JOB_CONTEXT: ${{ toJson(job) }}
        run: echo "$JOB_CONTEXT"
      - name: Dump steps context
        env:
          STEPS_CONTEXT: ${{ toJson(steps) }}
        run: echo "$STEPS_CONTEXT"
      - name: Dump runner context
        env:
          RUNNER_CONTEXT: ${{ toJson(runner) }}
        run: echo "$RUNNER_CONTEXT"
      - name: Dump strategy context
        env:
          STRATEGY_CONTEXT: ${{ toJson(strategy) }}
        run: echo "$STRATEGY_CONTEXT"
      - name: Dump matrix context
        env:
          MATRIX_CONTEXT: ${{ toJson(matrix) }}
        run: echo "$MATRIX_CONTEXT"

参考

Sat, 13 Dec 2025 02:14:42 GMT

默认情况只有push和pull request动作才会触发构建

yaml

on:
  push:
    branches: [ main ]
  pull_request:
    branches: [ main ]

最简单的做法，添加workflow_dispatch动作

yaml

on:
  workflow_dispatch:
  push:
    branches: [ main ]
  pull_request:
    branches: [ main ]

这样在actions页面可以看到执行构建的按钮，选择分支后可以执行手动构建。

yaml

on:
  workflow_dispatch:
    inputs:
      name:
        description: 'Person to greet'
        required: true
        default: 'Mona the Octocat'
      home:
        description: 'location'
        required: false

jobs:
  say_hello:
    runs-on: ubuntu-latest
    steps:
    - run: |
        echo "Hello ${{ github.event.inputs.name }}!"
        echo "- in ${{ github.event.inputs.home }}!"

关于手动触发还支持自定义输入文本，也就是输入文本当成传入的参数，用在后续的构建命令中

参考

https://p3terx.com/archives/github-actions-manual-trigger.html

https://docs.github.com/en/free-pro-team@latest/actions/reference/events-that-trigger-workflows#manual-events

Sat, 13 Dec 2025 02:14:42 GMT

参考官网文档

如果需要开启runner的运行日志，只需要在settings中添加一对secret，key为ACTIONS_RUNNER_DEBUG，值为true 如果需要开启step的运行日志，只需要在settings中添加一对secret，key为ACTIONS_STEP_DEBUG，值为true

下图开启debug前后的输出信息对比

另外在action运行中会带有一些诸如执行环境，当前job，当前runner，当前仓库，执行用户等上下文变量。想查看都有哪些集具体的变量可以加入steps

    steps:
      - name: Dump GitHub context
        env:
          GITHUB_CONTEXT: ${{ toJson(github) }}
        run: echo "$GITHUB_CONTEXT"
      - name: Dump job context
        env:
          JOB_CONTEXT: ${{ toJson(job) }}
        run: echo "$JOB_CONTEXT"
      - name: Dump steps context
        env:
          STEPS_CONTEXT: ${{ toJson(steps) }}
        run: echo "$STEPS_CONTEXT"
      - name: Dump runner context
        env:
          RUNNER_CONTEXT: ${{ toJson(runner) }}
        run: echo "$RUNNER_CONTEXT"
      - name: Dump strategy context
        env:
          STRATEGY_CONTEXT: ${{ toJson(strategy) }}
        run: echo "$STRATEGY_CONTEXT"
      - name: Dump matrix context
        env:
          MATRIX_CONTEXT: ${{ toJson(matrix) }}
        run: echo "$MATRIX_CONTEXT"

Sat, 13 Dec 2025 02:14:42 GMT

官网产品文档
Actions flow 一个 GitHub Actions 的模板库，用于对网上各种数据源，进行自动化组合操作，类似于 IFTTT。
starter-workflow 提供很多例子，比如 Laravel 的

Sat, 13 Dec 2025 02:14:42 GMT

Deploying to Google Kubernetes Engine

https://docs.github.com/en/actions/guides/deploying-to-google-kubernetes-engine

最开始的方案，在服务器直接拉代码部署

Sat, 13 Dec 2025 02:14:42 GMT

最开始的方案，在服务器直接拉代码部署

通过ssh登录服务器，然后执行git pull, npm build等构建命令需要提前在github仓库的setting页面配置ssh host，password，user等环境变量

优点：简单粗暴

缺点：直接在服务器上拉代码并不是最好的办法，而且还需要配置ssh，对于前端项目一般只需要构建后的dist目录。而且有时候国内服务器直接拉github仓库的代码会超时。

yaml

# This is a basic workflow to help you get started with Actions

name: CI

# Controls when the action will run. Triggers the workflow on push or pull request
# events but only for the master branch
on:
  push:
    branches: [ master, develop ]
  pull_request:
    branches: [ master ]

# A workflow run is made up of one or more jobs that can run sequentially or in parallel
jobs:
  # This workflow contains a single job called "build"
  build:
    # The type of runner that the job will run on
    runs-on: ubuntu-latest

    # Steps represent a sequence of tasks that will be executed as part of the job
    steps:

    # Runs a single command using the runners shell
    - name: Run a one-line script
      run: echo Hello, world!

    # Runs a set of commands using the runners shell
    - name: SSH Remote Commands
      uses: appleboy/[email protected]
      with:
        host: ${{ secrets.HOST }}
        username: ${{ secrets.USERNAME }}
        key: ${{ secrets.PRIVATE_KEY }}
        port: ${{ secrets.PORT }}
        script: cd /home/mafei20191103/IntoGolfV3 && git reset --hard origin/develop && git pull && npm run prod && php artisan migrate && composer install && php artisan telescope:prune && composer dump-autoload -o;

    # Slack Notification
    - name: Slack Notification
      uses: 8398a7/action-slack@v3
      with:
        status: ${{ job.status }}
        fields: repo,message,commit,author,action,eventName,ref,workflow,job,took # selectable (default: repo,message)
      env:
        GITHUB_TOKEN: ${{ secrets.PERSONAL_TOKEN }} # optional
        SLACK_WEBHOOK_URL: ${{ secrets.SLACK_WEBHOOK_URL }} # required
      if: always() # Pick up events even if the job fails or is canceled.

优化方案，使用rsync 同步文件

基于ssh deploy 原理是在action的机器中拉代码，构建，然后使用rsync命令将产物同步到目标服务器的指定目录中

好处：解决了超时问题，同步速度也不慢

待优化，如果文件非常多，是否可以压缩后然后再目标服务器上解压。

Sat, 13 Dec 2025 02:14:42 GMT

https://docs.bitnami.com/tutorials/create-ci-cd-pipeline-jenkins-gke/

大致流程:

Sat, 13 Dec 2025 02:14:42 GMT

大致流程:

Github 提交代码 -> 触发WebHook -> 触发Jenkins 执行 build

Github 部分：

建立仓库： https://github.com/mafeifan/docker-express-demo 这是一个非常简单的Node Express的项目，自带Dockerfile文件，我们需要每次push代码，在Jenkins服务器上构建新的Docker镜像和容器。
生成 personal access token (如果是私有项目)

配置项目的Webhook地址

地址获取在Jenkins系统设置页面，还可以覆盖默认的地址

Jenkins 部分

安装 Github 插件 (一般默认就会安装)
添加 Jenkins credentials

我们发现credentials分好几种，对于公有仓库，选择用户名和密码即可，如果是私有仓库可以选择“ssh username with private key” 或者 "Secret" (内容填入刚生成的Github token) ID 自己起，要唯一，创建后无法修改 3. 创建Item，类型选择"FreeStyle Project"

配置

总结

流程非常简单，只是个人练习，不要运用在正式项目中
有很多优化的地方，比如build后需要执行的shell脚本完全可以放入到项目仓库中受版本控制

Sat, 13 Dec 2025 02:14:42 GMT

Parameterized Trigger Plugin

这个插件可以触发基于某一个job的构建结果触发一个新的构建，而且支持传入参数

https://stackoverflow.com/questions/9704677/jenkins-passing-variables-between-jobs

基础

Sat, 13 Dec 2025 02:14:42 GMT

基础

Linux中，系统在启动一个进程的同时会为该进程打开三个文件：标准输入（stdin）、标准输出（stdout）和标准错误输出（stderr），分别用文件标识符0，1，2来标识。如果要为进程打开其他的输入输出，则需要从整数3开始标识。默认情况下，标准输入为键盘，标准输出和错误输出为显示器。

输入输出可以重定向，如 ls -l 会在显示器上看到结果，为了将结果输出到文件中，可以改为 ls -l /user > result.txt 如果ls命令后面跟的指定文件不存在呢？标准输出覆盖重定向(>) 其实是默认将文件标识符为1的内容重定向到指定文件中，所以下面两种写法等价

ls -l /user > result.txt
ls -l /user 1 > result.txt

可以通过指定将文件标识符为2的内容重定向到指定文件，这样错误输出就不会出现在显示器上。 ls -l /noExist 2 > no_exist_result.txt

标识输出重定向 >& &"">

将一个标准的输出重定向到另一个标识的输入。如果想要将标准输出和标准错误同时定向到同一个文件，可使用下面命令 COMMAND > stout_stderr.txt 2 > &1 举例： find / -type f -name *.txt 会报权限问题，如果使用find / -type f -name *.txt > result.txt 只能将标准输出重定向到result文件，错误输出依然会出现在显示器上，使用 find / -type f -name *.txt 2 > &1 可避免类似问题

而且不需要记录错误记录，可以将错误输出到'黑洞'里，常见的是 nohup command >/dev/null 2>&1 &

参考

Linux里的2>&1究竟是什么

https://jenkins.io/doc/pipeline/steps/workflow-durable-task-step/#-sh-%20shell%20script

`sh`: Shell Script

script

Runs a Bourne shell script, typically on a Unix node. Multiple lines are accepted.

An interpreter selector may be used, for example:#!/usr/bin/perl

Otherwise the system default shell will be run, using the-xeflags (you can specifyset +eand/orset +xto disable those).
- Type:String
encoding(optional)

Encoding of process output. In the case ofreturnStdout, applies to the return value of this step; otherwise, or always for standard error, controls how text is copied to the build log. If unspecified, uses the system default encoding of the node on which the step is run. If there is any expectation that process output might include non-ASCII characters, it is best to specify the encoding explicitly. For example, if you have specific knowledge that a given process is going to be producing UTF-8 yet will be running on a node with a different system encoding (typically Windows, since every Linux distribution has defaulted to UTF-8 for a long time), you can ensure correct output by specifying:encoding: 'UTF-8'
- Type:String
label(optional)

Label to be displayed in the pipeline step view and blue ocean details for the step instead of the step type. So the view is more meaningful and domain specific instead of technical.
- Type:String
returnStatus(optional)

Normally, a script which exits with a nonzero status code will cause the step to fail with an exception. If this option is checked, the return value of the step will instead be the status code. You may then compare it to zero, for example.
- Type:boolean
returnStdout(optional)

If checked, standard output from the task is returned as the step value as aString, rather than being printed to the build log. (Standard error, if any, will still be printed to the log.) You will often want to call.trim()on the result to strip off a trailing newline.

在线文档

Sat, 13 Dec 2025 02:14:42 GMT

在线文档

官方提供的pipeline例子

监控工具

代码质量

Allure 生成更美观的测试报告
SonarQube 质量检查
PMD 静态代码分析

Jenkins run in Docker 问题

Sat, 13 Dec 2025 02:14:42 GMT

Jenkins run in Docker 问题

通过docker 跑的 Jenkins 安装插件失败 Also: java.lang.Throwable: HttpInput failure 可能是Docker配置的网络问题第二天，又自己好了。。

https://issues.jenkins-ci.org/browse/JENKINS-58073?page=com.atlassian.jira.plugin.system.issuetabpanels%3Aall-tabpanel

插件

Publish Over SSH

Remote directory 参数问题

Publish Over SSH是款很常用的插件，一般用于通过SSH将构建后的文件传到远程主机上。其中的Remote directory选项是相对的登录后的路径。而不是远程主机的全路径比如你登录主机后的pwd是/home/mafei/。即便你在Jenkins配置中填的Remote directory是/var/www。执行后的实际路径是 /home/mafei/var/www

execCommand 是要在远程主机上执行的shell命令

有两种方式：

第一种，在远程主机上放一个sh文件里面包含所有要在主机上执行的操作，比如deploy.sh execCommand: '''sh deploy.sh'''

第二种，把具体命令都写execCommand里面下面的脚本有一定的通用性，首先将之前步骤构建的dist压缩，上传到远程服务器，然后在远程上执行下面的命令，先重命名老的dist，然后将新的压缩包解压

execCommand: '''
# sh deploy.sh
# 这里可以定义变量
# DEST_PATH 项目的发布路径
DEST_PATH=/var/www/web/
TODAY=$(date +%Y%m%d-%H%M%S)

cp -rf dist.gz $DEST_PATH
cd $DEST_PATH
tar -zcvf $TODAY-dist.gz dist
rm -rf dist
tar -xzvf dist.gz
'''

使用注意事项：

Source files(要上传的文件) 和 Exec command(要在远程服务器执行的命令) 至少有一个必填的, 如果 Source files 为空，什么也不会传
Source files, Remove prefix, Remote directory 和 Exec command 这几个参数，可以使用 Jenkins 的environment variables 和 build parameters.

Extended E-mail Notification

配置Gmail 勾选 SSL，端口填写 465

首次登陆 Google 会阻止，建议调低安全

参考

Sat, 13 Dec 2025 02:14:42 GMT

groovy

#!groovy
import hudson.model.*;
 
println env.JOB_NAME
println env.BUILD_NUMBER
 
pipeline{
	
	agent any
	stages{
		stage("Check file download") {
			steps {
				script {
					try{
                        // 第二种写法
                        // 把linux执行打印结果存在一个字符串中，通过字符串包含的方法去判断文件是否存在
                        // out = sh(script: "ls /tmp/test ", returnStdout: true).toString().trim()
					    out = sh(script: "[ -f /tmp/test1/Python-3.7.1.tgz ]  && echo 'true' || echo 'false' ", returnStdout: true)
					    println out
                        // if(out.contains("Python-3.7.1.tgz")) {
					    if(out == "true") {
						    println "file download successfully."
					    } else {
                            // 进入异常            
							sh("exit 1")
						}
					} catch(Exception e) {
						println e
						error("fond error during check file download.")
					}
				}
			}
		}
	}
}

参考

https://blog.csdn.net/u011541946/article/details/84945882

创建名为docker的用户组

Sat, 13 Dec 2025 02:14:42 GMT

服务器确保已经安装了docker和docker-compose。当前用的是 Docker version 18.09.7, build 2d0083d docker-compose version 1.24.0, build 0aa59064

下面的操作是当执行 docker 或 docker-compose 不用带 sudo

bash

# 创建名为docker的用户组
sudo groupadd docker
# 把当前用户加入到这个用户组中
sudo usermod -aG docker $USER
# 重登session
# 测试，不带sudo跑一个测试镜像
docker run hello-world

新建 jenkins 用户

bash

# 创建jenkins用户并添加同名组、创建用户目录,默认shell为bash
$ sudo useradd -mU jenkins -s /bin/bash 
$ sudo passwd jenkins #重置密码
$ su jenkins #使用jenkins用户登录
$ cd ~ #进入/home/jenkins目录

新建 jenkins-compose目录并在里面添加docker-compose.yml 文件，内容如下：

yaml

version: '3'

services:
  jenkins-compose:
    # 注意镜像名称，lts表示长期支持版
    image: jenkins/jenkins:lts
    privileged: true # 解决权限问题
    restart: always 
    ports:
     - "8088:8080"
     - "50000:50000"
    environment:
     - JAVA_OPTS=-Duser.timezone=Asia/Shanghai
    volumes:
     - /var/run/docker.sock:/var/run/docker.sock
     - /usr/bin/docker:/usr/bin/docker
     - /home/ubuntu/jenkins-compose:/var/jenkins_home

执行 docker-compose up -d jenkins-compose 会下载镜像并在后台启动然后 docker-compose logs 查看日志

留意并复制红框中的密码

浏览器打开Jenkins地址，地址应该是服务器ip:8088

TIP

打不开的话检查下防火墙开放8088端口

粘贴刚复制的密码，点Continue

安装插件，建议选第一个

安装完成后会自动跳转到管理员用户界面

最终来到了欢迎页面

修改时区

在【系统管理】-【脚本命令行】里运行 System.setProperty('org.apache.commons.jelly.tags.fmt.timeZone', 'Asia/Shanghai')

修改Jenkins插件为国内源

首页 --> configure --> Manage Jenkins --> Advanced --> Update Site（页面最下方‘升级站点’）

替换URL为清华大学仓库地址：

https://updates.jenkins.io/update-center.json 改为 https://mirror.tuna.tsinghua.edu.cn/jenkins/updates/update-center.json

如果插件页面为空，把https改为http

问题：

Jenkins更新比较频繁，如何更新版本？见 medium 的这篇文章

创建多分支项目

Sat, 13 Dec 2025 02:14:42 GMT

Updated: 2019-08-15

如果希望通过 Webhook 触发 multibranch pipeline 项目需要安装 multibranch-scan-webhook-trigger-plugin 插件安装完之后，配置界面多出一个 Scan by webhook 选项

实际中一个项目的代码仓库可能会有很多分支，比如develop，master等。Jenkins 支持创建多分支pipeline的任务。

创建多分支项目

新建 "Item" 直接选择 "Multibranch Pipeline" 即可 Tab中有很多配置项，比如 General，Branch Sources，Build Configuration等

Scan Multibranch Pipeline Triggers 触发扫描分支频率，最低是1分钟

Orphaned Item 孤儿任务，所谓孤儿任务即代码仓库中该分支被删除，但是Jenkins分支中还保留着。

Health metric 健康指标我也不清楚有什么用，望指教

WARNING

配置完成后，Jenkins就会自动执行首次构建，首先扫描所有的分支，如果根据配置的路径去找Jenkinsfile，找到后就立即执行。

根据发现的分支数量，比如这里3个就自动创建了3个pipeline项目，点进去后可以像pipeline任务一样进行详细配置。

使用 when 指令判断多分支

我们需要判断针对不同分支做不同事情，使用 if else 比较low，不够优雅

groovy

stage("deploy to test") {
  steps {
      script {
          if (env.GIT_NAME == 'testing') {
            echo 'deploy to test'
          }
     }
   }
}

可以使用 when 指令

groovy

stage("deploy to test") {
  when {
    branch 'testing'
   }
    steps {
      echo 'deploy to test'
    }
}

stage("deploy to prod") {
  when {
    branch 'production'
  }
   steps {
      echo 'deploy to prod'
   }
}

when指令的用法

when指令允许pipeline根据给定的条件，决定是否执行阶段内的步骤。when指令必须至少包含一个条件。when指令除了支持branch判断条件，还支持多种判断条件。

changelog：如果版本控制库的changelog符合正则表达式，则执行
changeset：如果版本控制库的变更集合中包含一个或多个文件符合给定的Ant风格路径表达式，则执行

groovy

when {
  changeset "**/*.js"
}

environment：如果环境变量的值与给定的值相同，则执行

groovy

when {
  environment name: 'DEPLOY_TO', value: 'production'
}

equals：如果期望值与给定的值相同，则执行

groovy

when {
  equals expected: 2, actual: currentBuild.number
}

expression：如果Groovy表达式返回的是true,则执行当表达式返回的是字符串时，它必须转换成布尔类型或null;否则，所有的字符串都被当作true处理。

groovy

when {
  expression {
    return env.BRANCH_NAME != 'master'
  }
}

building Tag：如果pipeline所执行的代码被打了tag,则执行
tag：如果pipeline所执行的代码被打了tag,且tag名称符合规则，则执行如果tag的参数为空，即tag ()，则表示不论tag名称是什么都执行，与buildingTag的效果相同。

groovy

when {
  tag "release-*"
}

tag 条件支持comparator参数，支持的值如下： -- EQUALS：简单的文本比较。

groovy

when {
  tag "release-3.1", comparator: "EQUALS"
}

-- GLOB (默认值)：Ant风格路径表达式。由于是默认值，所以使用时一般省略。完整写法如下:

groovy

when {
  tag "release-*", comparator: "GLOB"
}

-- REGEXP：正则表达式。使用方法如下:

groovy

when {
  tag "release-\\d+", comparator: "REGEXP"
}

tag条件块非常适合根据tag进行发布的发布模式。

以上介绍的都是单条件判断，when指令还可以进行多条件组合判断。

allOf：所有条件都必须符合。下例表示当分支为master且环境变量DEPLOY TO的值为production时，才符合条件。

groovy

allOf {
  branch "master";
  environment name: 'DEPLOY_TO', value: 'production'
}

注意，多条件之间使用分号分隔。

anyOf：其中一个条件为true, 就符合。下例表示master分支或staging分支都符合条件。

groovy

anyOf {
  branch "master";
  branch "staging";
}

Generic Webhook Trigger 插件在多分支pipeline场景下的应用

Generic Webhook Trigger 在之前已经介绍过，可以这么传参

groovy

    triggers {
        GenericTrigger(
            genericVariables: [
              [key: 'ref', value: '$. ref']
            ],
            token: env.JOB_NAME ,
            regexpFilterText: '$ref',
            regexpFilterExpression: 'refs/heads/' + env.BRANCH_NAME,
        )
    }

env.BRANCH_NAME 为当前 pipeline 的分支名

问题

Multibranch Pipeline Events 的作用是什么

参考

converting-conditional-to-pipeline/

Pipeline Parameter

Sat, 13 Dec 2025 02:14:42 GMT

有些项目的构建需要动态的传入一些参数，比如需要用户输入一些内容，或者上传一个文件，或者为一些配置打钩，作为不同的参数，当构建时这些参数作为环境变量来影响具体的构建过程。

比如，我们知道sh "printenv"会打印所有的环境变量方便调试，但是如果写死在pipeline里，每次构建 console output都会输出大量内容。比如现在

groovy

stage('debug') {
  steps {
    sh "printenv"
  }
}

我希望构建时可以手动控制是否输出调试信息。默认为关闭，即不输出，打钩后才输出信息。

下面的例子就讲解如何实现

当我们新建的项目为freestyle或pipeline类型，在配置页面的General的tab中会发现有一个选项为 "This project is parameterized" 表示该项目类型为可参数化的，勾选之后，可以添加很多类型的参数，如下图

比如我这里添加一个Boolean Parameter，参数名称为is_print_env，默认不显示环境变量信息，即不希望执行sh "printenv"

修改之前的pipeline，根据is_print_env的取值走不同的逻辑。

groovy

stage('debug') {
  steps {
    // echo env.is_print_env
    script {
      if (env.is_print_env) {
          sh "printenv"
      } else {
         echo "no execute 'sh printenv'"
      }
    }
  }
}

保存之后来到该项目的首页，左侧功能列表中会发现之前的"Build now"变为了"Build with parameters"。点击后，刚才的Boolean Parameter参数配置就可视化了。

如果勾选了，就会输出所有的环境变量

Pipeline Parameter

上面的参数是在页面上手动添加，实际上如果是pipeline类型的job，可以用代码的方式是实现，这样更灵活，更容易版本化管理 pipeline语法支持传入parameters指令，parameter 包括 string， text(多行文本), boolean, choice(下拉)，file 文件类型(很少用)， password(密码类型)等。

groovy

pipeline {
  agent any

  parameters {
    booleanParam(defaultValue: true, description: '', name: 'p_userFlag')
        
    choice(
       choices: 'dev\nprod',
       description: 'choose deploy environment',
       name: 'p_deploy_env'
   )
   string (name: 'p_version', defaultValue: '1.0.0', description: 'build version')
 
   text (name: 'p_deploy_text', defaultValue: 'One\nTwo\nThree', description: '')

   password (name: 'p_password', defaultValue: '', description: '')
  }
}

保存后需要手动执行一次，才能在页面中看到效果

被传入的参数会放到名为params的对象中，在pipeline中可以直接使用，比如params.userFlag就是引用parameters指令中定义的userFlag参数

根据参数进行逻辑判断

groovy

stage('debug') {
    steps {
        script {
            if (params.p_deploy_env == 'dev') {
                 echo "deploy to dev"
            } 
        }
    }
}

可以安装 Conditional BuildStep 像使用 when 指令一样进行条件判断。下面安装插件后的写法

groovy

pipeline {
  agent any

 parameters {
   choice(name: 'CHOICES', choices: 'dev\nstaging', description: '请选择部署环境')
 }

 stages {
   stage('deploy test')  {
     when {
       expression( return params.CHOICES == 'test')
     }
     scripts {
       echo 'deploy to test'
     }
   }
   stage('deploy staging')  {
     when {
       expression( return params.CHOICES == 'staging')
     }
     scripts {
       echo 'deploy to staging'
     }
   }
 }
}

expression 本质是Groovy代码块，可以写出更复杂的逻辑判断

groovy

when {
   expression {  return A || B || C && D }
}

从文件中提取

groovy

when {
   expression {  return readFile('pom.xml'.contains('foo'))  }
}

正则

groovy

when {
   expression {  return return token ==~ /(?i)(Y|YES|TRUE)/)  }
}

input 步骤

执行 input 步骤会暂停pipeline，直到用户输入参数。场景： 1 审批流程，pipeline暂停在部署前的stage，由负责人点击确定后才能部署。 2 手动测试，增加一个手动测试stage，该阶段只有一个input步骤，当手动测试通过后才可以通过这个input步骤。

pipeline中添加input的step

groovy

pipeline {
  agent any

 stages {
   stage('deploy')  {
     steps {
       input message: '发布或停止' // 如果只有一个messge参数，可以简写为 input  '发布或停止'
     }
   }
}

无论是中止还是通过，job日志中都记录了谁操作的，这对审计非常友好

使用共享库

Sat, 13 Dec 2025 02:14:42 GMT

当有大量的pipeline项目构建任务，有很多代码是重复的，这时需要提取和复用共同的逻辑。其实pipeline本质就是一个Groovy脚本，所以可以在pipeline中自定义函数，并使用Groovy语言自带的特性。比如下面的Jenkinsfile，我们自定义了一个 createVersion 函数，并使用了内置的Date类。

groovy

pipeline {
    agent any
    
    stages {
        stage ('build') {
            steps {
                // 输出 当前日期和构建编号
                echo "${createVersion(BUILD_NUMBER)}"
            }
        }
    }
}

def createVersion(String BUILD_NUMBER) {
    return new Date().format('yyyy-MM-dd') + "-${BUILD_NUMBER}"
}

还有一种更优雅的写法，将变量定义在environment内

groovy

pipeline {
    agent any
    
    environment {
       _version = createVersion()
    }
    
    stages {
        stage ('build') {
            steps {
                echo "${_version}"
            }
        }
    }
}

def createVersion() {
    return new Date().format('yyyy-MM-dd') + "-${env.BUILD_NUMBER}"
}

使用共享库

大致流程：

新建个代码仓库，里面包含共享库代码目录结构类似

(root)
+- src                     # Groovy source files
|   +- org
|       +- foo
|           +- Bar.groovy  # for org.foo.Bar class
+- vars
|   +- foo.groovy          # for global 'foo' variable
|   +- foo.txt             # help for 'foo' variable
+- resources               # resource files (external libraries only)
|   +- org
|       +- foo
|           +- bar.json    # static helper data for org.foo.Bar

这里已经建好 jenkins-shared-library，文件结构如下：

vars 目录下的全局变量可以直接在pipeline中使用，即当写sayHello('world')，实际调用的是sayHello.groovy中的call函数

src 目录是标准的Java源码结构，目录中的类被称为类库(Library class)，而 @Library('global-shared-library@master') 就是一次性静态加载src目录下所有代码到classpath中。

TIP

src目录中的类，可以使用Groovy中的@Grab注解，自动下载第三方依赖包

Jenkins 管理后台配置仓库地址和版本等进入 Jenkins 的Manage Jenkins -> Configure System -> Global Pipeline Libraries 配置页面

Jenkins 项目的pipeline中引入共享库(可以指定仓库版本和具体class) 新建一pipeline类型的job。 Pipeline内容如下:

groovy

// 配置页面开启隐式加载后，可以直接使用共享库
// 定义library，命名为_
@Library('global-shared-library@master') _
pipeline {
    agent any
    
    environment {
       _version = createVersion()
    }
    
    stages {
        stage ('build') {
            steps {
                script {
                    def util = new com.mafeifan.Utils()
                    def version = util.createVersion("${BUILD_NUMBER}")
                    echo "${version}"
                    sayHello 'yes'
                    echo "${_version}"
                }
            }
        }
    }
}

def createVersion() {
    return new Date().format('yyyyMM') + "-${env.BUILD_NUMBER}"
}

查看构建日志，发现Jenkins首先拉取共享库代码，执行成功。

指定加载

后台配置共享库是非必须的，我们可以直接在pipeline中指定共享库的位置，如下面的例子，指定共享库的位置是https://gitee.com/finley/devops-jenkins-shared-library.git 引入后直接调用共享库中的方法

groovy

library identifier: 'devops-ws-demo@master', retriever: modernSCM([
    $class: 'GitSCMSource',
    remote: 'https://gitee.com/finley/devops-jenkins-shared-library.git',
    traits: [[$class: 'jenkins.plugins.git.traits.BranchDiscoveryTrait']]
])

// 另外的写法，需要在后台配置，注意名称要一致
//@Library('devops-ws-demo') _
//@Library('devops-ws-demo@test') _

pipeline {
    agent any

    stages {
        stage('Demo') {
            steps {
                script {
                    mvn.fake()
                }
            }
        }
    }
}

使用共享库实现Pipeline模板

// vars/generatePipeline.groovy

groovy

def call(String lang) {
  if (lang == 'go') {
    pipeline {
      agent any
       stages {
         stage ('set go path') {
            steps {
               echo "GO path is ready"
            }
         }
       }
    } 
  } else if (lang == 'java') {
    pipeline {
      agent any
       stages {
         stage ('clean install') {
            steps {
               sh "mvn clean install"
            }
         }
       }
    } 
  }
  // 其他语言
}

使用时，Jenkinsfile 只有两行

groovy

@Library['global-shared-library'] _
generatePipeline('go')

如果大多数项目都是标准化的，可以利用共享库的pipeline模块技术来降低维护成本。

这里只是抛砖引玉，想写出更强大的共享库需要多了解Groovy。

TIP

优先考虑使用自定义函数，如果此函数出现在了至少三个项目中，考虑移到共享库里，当发现项目的pipeline非常相似，考虑使用pipeline模块。

参考

https://jenkins.io/zh/doc/book/pipeline/shared-libraries/

mafeifan 的编程技术分享

功能介绍

功能介绍

使用方法

工作流程

简单描述：

参考

`=` 和 `:=` 的区别

= 和 := 的区别

实际开发建议

为什么结构体作为函数参数，前面要加 *

下面两个写法等价吗

any

DevOps 知识图谱

DevOps 知识图谱

说明

统计数据

关于本站

关于本站

animate API

animate API

slideUp 等二次封装的方法

animate 队列

loop 循环播放

使用场景

Runtime API Examples

Runtime API Examples

Results

Theme Data

Page Data

Page Frontmatter

More

友情链接 & 优秀站点

友情链接 & 优秀站点

Markdown Extension Examples

Syntax Highlighting

Custom Containers

OpenRouter 快速获取 ChatGPT API Key

OpenRouter 快速获取 ChatGPT API Key

前提

手把手教程

手把手教程

LangChain

Bedrock Access Gateway

AWS 切换用户

AWS 切换用户

帐号 A 下创建 IAM Role

帐号 B Assume 帐号 A 的 role

用 Python 的 boto3 包实现

参考

痛点

痛点

什么是CloudFormation

CloudFormation模板

实战

参考

如何修改Userdata

如何修改Userdata

参考

IAM role creation

IAM role creation

ECS new task

Commands I used to exec in

Option1

Option2

参考

assuming role

assuming role

参考

Serverless 的重点

Serverless 的重点

Lambda

地域 Region

地域 Region

可用区 AZ（Availability Zone）

虚拟私有网络 VPC

多业务系统隔离

多地域部署系统

CIDR

Subnet

`=` 和 `:=` 的区别