Tech | 董江博客 | DongJiang Blog

Posted by Kubeservice博客 on Friday, February 14, 2025

AI之模型管理： huggingface 数据集/模型库上传和下载

huggingface 数据集/模型库上传和下载

huggingface 数据集/模型库上传和下载环境准备云原生时代，golang为王；而AI时代，Python为王。需要安装Python相关的环境和libary包

Posted by 董江 on Thursday, February 13, 2025

AI之（大）模型推理服务部署管理 - 模型版本、模型启动

ollama vs vllm vs SGLang

模型推理服务部署管理 - 模型版本、模型启动、openai接口标准提供模型推理部署工具模型部署，类似与docker可以方便的类似于docker run

Posted by 董江 on Wednesday, February 12, 2025

技术方案之 Kubernetes大规模容器网络优化

Kubernetes大规模容器网络优化

技术方案之 Kubernetes大规模容器网络优化背景 1.1 大规模集群特点大业务：单模块超大规模副本（300+）小业务：资源减少边际成本（平摊控制

Posted by 董江 on Monday, January 6, 2025

技术分享之 CoreDNS 集群层粒度 autoscaling

CoreDNS 集群层粒度 autoscaling

CoreDNS DNS集群粒度 autoscaling 第一篇：使用 NodeLocal DNSCache 提高 clusterDNS 性能和可靠性一、什么是集群比例自动扩缩器 (Cluster Proportional Autoscaler即CPA) ？集群比例自动扩缩器 (CPA) 是一

Posted by 董江 on Monday, November 11, 2024

DevOps之日志采集存储性能对比 es vs loki vs victorialogs

日志采集存储性能对比 es vs loki vs victorialogs

存储引擎介绍 elasticsearch 不多介绍 loki Promtail 采集器，通过daemonset方式部署在全部node上。通过promtail中 configmap 配置两个东西： a.配置固定路径下的

Posted by 董江 on Wednesday, October 23, 2024

DevOps设计之 Kubenetes 容器日志收集方案

Kubenetes 容器日志收集方案

Kubenetes 容器日志收集方案应用日志收集痛点业务无要求: div.notices { margin: 2rem 0; position: relative; } div.notices p { padding: 15px; white-space: pre-wrap; display: block; margin-top: 0rem; margin-bottom: 0rem; color: #666; } div.notices p:first-child:before { position: absolute; top: 2px; color: #fff; font-family: "Font Awesome 5 Free"; font-weight: 900; content: "\f06a"; left: 10px; } div.notices p:first-child:after

Posted by 董江 on Tuesday, June 11, 2024

技术方案之 Kubernetes Pod/Container NUMA亲和管理

Kubernetes Pod/Container NUMA亲和管理

Kubernetes Pod/Container NUMA亲和管理背景先前工作中大量使用基于CPU、Memory亲和的感知调度实现，目前对这部分统一梳理下，，NUMA 感知涉及 memory 和cpu的

Posted by 董江 on Thursday, April 18, 2024

Kubeservice博客

AI之模型仓库： model register 开源实现 modelx 2.0

基于kubegems/modelx实现开源模型仓库： modelx 2.0

AI之模型管理： huggingface 数据集/模型库上传和下载

huggingface 数据集/模型库上传和下载

AI之（大）模型推理服务部署管理 - 模型版本、模型启动

ollama vs vllm vs SGLang

技术方案之 Kubernetes大规模容器网络优化

Kubernetes大规模容器网络优化

技术分享之 CoreDNS 集群层粒度 autoscaling

CoreDNS 集群层粒度 autoscaling

DevOps之日志采集存储性能对比 es vs loki vs victorialogs

日志采集存储性能对比 es vs loki vs victorialogs

DevOps设计之 Kubenetes 容器日志收集方案

Kubenetes 容器日志收集方案

技术方案之 Kubernetes Pod/Container NUMA亲和管理

Kubernetes Pod/Container NUMA亲和管理

QUICK LINKS

FEATURED TAGS

AI之 模型仓库： model register 开源实现 modelx 2.0

基于kubegems/modelx实现开源模型仓库： modelx 2.0

AI之 模型管理： huggingface 数据集/模型库 上传和下载

huggingface 数据集/模型库 上传和下载

AI之 （大）模型推理服务部署管理 - 模型版本、模型启动

ollama vs vllm vs SGLang

技术方案之 Kubernetes大规模容器网络优化

Kubernetes大规模容器网络优化

技术分享之 CoreDNS 集群层粒度 autoscaling

CoreDNS 集群层粒度 autoscaling

DevOps之 日志采集存储性能对比 es vs loki vs victorialogs

日志采集存储性能对比 es vs loki vs victorialogs

DevOps设计之 Kubenetes 容器日志收集方案

Kubenetes 容器日志收集方案

技术方案之 Kubernetes Pod/Container NUMA亲和管理

Kubernetes Pod/Container NUMA亲和管理

QUICK LINKS

FEATURED TAGS

AI之模型仓库： model register 开源实现 modelx 2.0

AI之模型管理： huggingface 数据集/模型库上传和下载

huggingface 数据集/模型库上传和下载

AI之（大）模型推理服务部署管理 - 模型版本、模型启动

DevOps之日志采集存储性能对比 es vs loki vs victorialogs