最新文章

2026年2月26日

秒触达、零资损:亲宝宝基于 Apache RocketMQ 支撑千万家庭实时互动与成长记录
AI 助成长:「亲宝宝 APP」千万 MAU 下的架构挑战 亲宝宝是一家专注于家庭育儿领域的移动互联网公司,其核心产品「亲宝宝 APP」聚焦性化育儿服务,集成长记录、育儿知识、早教内容、家庭共享、智能推荐及 AI 育儿助手等功能于一体,致力于打造一个围绕儿童成长的家庭私密社交与育儿服务平台。 自 2012 年成立以来,亲宝宝注册用户总数已突破一亿,月活跃用户(MAU)超千万,日均上传照片/视频数量达数百万条,平台沉淀了海量的用户行为数据和成长内容数据。其技术架构需要支撑高并发写入、实时消息触达、个性化推荐、数据一致性保障等复杂场景,对底层中间件系统提出了极高要求。 高并发、强一致性与实时触达的三重压力 随着用户规模持续增长,亲宝宝面临三大核心挑战: 1. 高频写入与异步处理压力 用户每日上传海量成长影像,需在保证体验的同时完成缩略图生成、AI 标签识别、多端同步等后处理任务,传统同步调用链路难以支撑。 2. 跨设备实时通知的可靠性要求 家庭成员间的新动态(如“爸爸上传了宝宝照片”)需在秒级内精准触达所有关联成员,且不能丢失或重复。 3. 分布式事务场景下的数据一致性难题 如用户完成任务获得积分、兑换权益等操作,涉及账户、订单、通知等多个微服务,必须保障“操作成功则消息必发”,否则将导致用户权益异常。 面对上述挑战,亲宝宝亟需一个高吞吐、低延迟、支持事务语义、具备完善可观测性的消息基础设施。 为什么选择阿里云 RocketMQ 5.x? 经过多轮技术评估,亲宝宝最终选择全面迁移至阿里云云消息队列 RocketMQ 版 5.x Serverless 系列。 核心原因如下: 1. Serverless 架构实现客户端轻量化 RocketMQ 5.x Serverless 通过引入独立的 Proxy 组件,将原本内嵌于客户端的路由、协议解析、重试等逻辑下沉至服务端,客户端仅需极简 SDK 即可完成消息收发。该架构不仅提升了系统的可维护性与安全性,也大幅降低了移动端的网络与内存开销,完美适配亲宝宝高并发、低功耗的终端环境。 2. 秒级精准延迟消息 RocketMQ 5.x Serverless 支持高精度延迟消息,通过秒级延迟消息实现“未读通知二次触达”、“临时草稿自动清理”、“成长里程碑倒计时提醒”等柔性业务逻辑,在提升用户体验的同时优化系统资源利用率。 3. 全链路可观测性 RocketMQ 5.x Serverless与阿里云 ARMS、SLS 等可观测产品深度集成,提供了从生产到消费的全链路消息轨迹追踪、消费延迟告警、堆积分析等运维闭环,极大简化运维工作,显著提升故障定位效率。 4. 云原生弹性伸缩与成本效益 亲宝宝的业务流量具有显著的“节日效应”,每逢春节、六一儿童节、开学季等高峰期,用户上传照片量可激增 3–5 倍,家庭通知消息峰值可达平日的 4 倍。过去自建 RocketMQ 集群需提前数周预估容量并手动扩容,成本高昂且难以精准预估偏差,导致资源浪费或服务降级。基于 RocketMQ 5.x Serverless,亲宝宝实现了真正的按需付费与秒级自动弹性伸缩,从容应对流量洪峰,同时大幅优化了资源成本。 核心应用场景与 RocketMQ 5.x 落地实践 ▍场景一:成长相册——高吞吐的异步处理流水线 当用户上传照片后,前端服务仅需完成元数据落库,并立即向 Topic_Photo_Process 发送一条普通消息。后端多个独立消费者组并行消费,分别执行各自负责的异步任务,如:图像压缩与多尺寸生成、AI 模型打标(如“笑脸”、“户外”等)、家庭成员推送通知、写入搜索索引等。得益于 RocketMQ 5.x Serverless 的百万级 TPS 吞吐能力与批量消费优化,整条处理流水线延迟稳定在 200ms 以内,系统资源开销降低 40%。 ▍场景二:成长印迹定时解锁——高精度的延迟消息应用 当用户为宝宝设置“时光信件”(如“18 岁生日开启”)或重要纪念日(如“百天纪念”)倒数提醒时,业务系统只需向 Topic_Growth_Reminder 发送一条延迟消息,延迟时间可精确到秒,跨度可从几分钟到数年。RocketMQ 5.x 服务端内置的高精度定时调度能力,确保消息在预定时刻被准时唤醒并投递。该方案极大简化了定时任务的实现,避免了传统数据库轮询带来的性能损耗与架构复杂性,为用户提供了温暖而可靠的长期约定功能。 ▍场景三:积分权益——强一致的事务消息保障 在用户完成“每日签到”等任务时,系统需同时完成“更新任务状态”和“发放积分/徽章”等操作。亲宝宝采用 RocketMQ 5.x 的事务消息机制来保障最终一致性,核心流程如下: 1. 应用发起本地事务(扣减任务状态); 2. 若成功,则向 RocketMQ 提交一条“半消息”; 3. RocketMQ 回查本地状态,确认后将已提交的消息投递至 Topic_Reward_Delivery; 4. 下游服务消费消息,完成发放徽章并触发 Push 通知。 该方案在亲宝宝过去一年的生产环境中,实现了事务消息成功率高达 99.999%,达成了积分权益业务的“零资损”目标。 成效与价值 通过全面采用阿里云 RocketMQ 5.x Serverless,亲宝宝在技术与业务层面均获得了显著收益: 更重要的是,RocketMQ 5.x 的 Serverless 架构将复杂逻辑下沉至服务端 Proxy,提供的轻量化 SDK 显著降低了亲宝宝移动端的网络开销与内存占用,为亿级用户的流畅 App 体验提供了坚实保障。 未来展望 AI 时代下,亲宝宝与阿里云消息团队紧密合作,积极探索 RocketMQ 5.x 在 AI 场景下的更多前沿能力: + 使用 RocketMQ LiteTopic,打造 AI 场景下 MultiAgent 的异步通信,解决长耗时调用阻塞痛点。 + 采用“会话即主题”——会话独占 LiteTopic,基于状态持久化机制,保障了会话的连续性和完整性,提升了会话用户体验,减少了会话需求重试成本。 + 利用 RocketMQ 优先级消息,实现算力资源最大价值分配,保障高优先级任务的资源分配。

2026年2月25日

古茗奶茶:借助 RocketMQ Serverless 实现下单丝滑、大促自由,综合降本 40%
最近,“千问请全国人民喝奶茶”活动火爆全网,这种瞬时爆发的流量洪峰已成为新茶饮行业的常态化挑战。新茶饮行业的数字化演进已从最初的基础设施上云,演进为深度的云原生架构共创与能力共建,再到为 AI 原生提供确定性基座,古茗奶茶在阿里云云原生上的深度实践,正是这种演进的代表。 在新茶饮行业,每一次刷屏级的营销活动,每一杯奶茶的“丝滑”下单,背后都是对数字化基座的严峻考验,是一场应对瞬时高并发流量的技术硬仗。 作为拥有超万家门店的行业头部品牌,古茗不仅要支撑海量日常订单,更需在“周三会员日”等大促时刻,从容应对流量陡增,确保系统稳如磐石。面对高并发下的极速响应与弹性需求,古茗如何实现“大促自由”? 本期《云故事探索》栏目走进古茗,揭秘支撑新茶饮“万店时代”的云原生力量。 从口味之争到体验之战,技术成为新茶饮竞争力 “如今,一杯奶茶的竞争已不仅限于口味。”古茗科技技术运维负责人刘星光表示,在新茶饮这条日趋激烈的赛道上,“口味决定品牌的记忆度,但真正拉开差距的,是门店高峰期的稳定体验、新品迭代的速度,以及消费者触达的精准度。” 对于古茗而言,数字化的核心价值并非上线了多少系统,而是打通了供应链、门店与营销等环节,以数据驱动决策,让成功的运营模式能在全国范围内快速复制。 这意味着技术团队的角色已从“系统维护者”升级为“业务赋能者”,不仅要保障系统稳定运行,更要支撑业务的高速增长与敏捷创新。 _古茗科技 技术运维负责人 刘星光_ 架构升级:微服务+DevOps,实现业务敏捷与体验统一 为支撑万店扩张与高频营销,古茗构建了以“微服务 + DevOps”为核心的云原生架构。订单、会员、库存、营销等核心业务被拆分为独立微服务,可独立开发、部署与扩缩容。其中,阿里云微服务引擎 MSE 作为服务注册与配置中心,在保障系统高可用的同时,也让古茗更聚焦业务研发。 架构升级带来的直接收益是迭代速度显著提升。刘星光表示:“一个新的优惠策略,如今可在数天内完成验证并上线,实现快速试错、快速复制。”2025 年,古茗完成底层架构的全面云原生升级,确保全国用户下单体验的一致性。 但微服务化也带来了调用链路复杂、峰值压力集中等挑战。要在流量洪峰下保持系统稳定,“异步解耦”与“流量削峰”成为关键,这正是消息队列的核心价值。 大促自由:RocketMQ Serverless 稳定可靠、弹性降本 每周三“会员日”,古茗中午 12 点的瞬时订单量可达平日数倍。传统架构下,需提前数天甚至数周预估流量、规划资源并手动扩容,不仅耗时费力,还伴随着稳定性风险与资源浪费。 在支付、营销、库存等核心链路中,古茗引入了阿里云云消息队列 RocketMQ 版 Serverless 系列,精准解决了三大痛点: 1. 极致弹性,告别容量焦虑与资源浪费 面对十万级 TPS 的瞬时并发请求,RocketMQ Serverless 无需人工干预即可秒级自动扩容,保障消息高吞吐、低延迟、不丢失、不积压,并在峰值结束后自动释放资源,真正实现按需使用、按量付费。据测算,该方案帮助古茗节省超 40% 成本。 2. 事务消息,保障业务数据最终一致性 在“支付成功后扣减库存并发放优惠券”等场景,数据一致性至关重要。RocketMQ 事务消息确保支付主流程与下游操作的最终一致性。即使下游服务短暂异常,可靠的重试机制也能保证业务最终成功,从根源上避免因数据不一致导致的资损与客诉风险。 3. 稳定可靠,让技术团队聚焦业务创新 RocketMQ 历经阿里巴巴十余年“双十一”万亿级数据洪峰验证,具备稳定可靠的 SLA 保障,并提供消息过滤、顺序消息等功能及完善的可观测工具,帮助古茗技术团队从繁琐的维稳工作中解放出来,更专注于业务创新。会员日由此成为业务增长的“加速器”,而非技术压力的“爆发点”。 _RocketMQ Serverless 架构及弹性示意图_ “拥抱云原生后,我们终于可以放手策划大规模活动了。”刘星光的话语中透露出十足的底气,“以前最怕系统崩溃,现在我们只需关心活动玩法能否打动用户。”这份底气,正源于以 RocketMQ Serverless 为代表的阿里云原生技术栈。 稳定第一:全链路可观测,让风险“可见可控” “稳定,永远是第一位的。”刘星光反复强调,“第一是稳定,第二是效率,第三是成本。” 为保障稳定性,古茗基于阿里云日志服务 SLS、应用实时监控服务 ARMS 等产品,构建了覆盖底层基础设施到上层业务逻辑的全链路可观测体系,实现多维度监控与实时告警,全面掌握系统状态。 刘星光表示:“任何一笔异常订单(如支付或领券失败),我们都能通过全链路追踪,在分钟乃至秒级内定位根因,从而快速修复,保障用户体验。” 从工具采纳到能力共建,从云原生迈向 AI 原生 古茗与阿里云的合作,已从工具采纳深化为场景共创(如优化事务消息延迟)与能力共建(如增强消息轨迹)。古茗真实的业务场景(如节假日大促、爆款联名发布)成为 RocketMQ Serverless 等阿里云产品的“极限压测场景”与“最佳实践样板”;阿里云则将经过古茗验证的架构模式产品化,赋能更多零售客户,形成相互成就、共同成长的深度伙伴关系。 面向未来,古茗正积极探索 AI 与业务的深度融合,包括智能推荐、经营分析、AIGC 营销等。他们的思路清晰而坚定:并非“从云原生切换到 AI 原生”,而是在云原生基础上,将 AI 能力逐步叠加,让技术架构与业务共同演进。 “云原生解决了弹性、稳定和标准化的问题,这恰恰是 AI 大规模落地的前提。”刘星光总结道,“只有底座足够稳,AI 才能真正服务于业务,而不是制造新的复杂性。” 一杯奶茶,一场深刻的技术革命 从一杯奶茶的“丝滑”下单,到一场大促的从容应对,古茗的故事是新茶饮数字化转型的缩影,也是云原生技术释放业务潜能的证明:新消费品牌的护城河,正在从产品和供应链向技术深度延伸。 以云消息队列 RocketMQ 版为代表的阿里云云原生产品,正凭借其极致弹性、高稳定性和领先技术,帮助像古茗这类高速发展的企业卸下技术包袱,在激烈的市场竞争中轻装上阵,将更多精力聚焦于业务创新,让“下单丝滑,大促自由”成为新常态。 未来,随着云原生与 AI 的进一步融合,每一杯奶茶的背后,都将蕴藏着一个更智能、更高效、更稳定的数字世界。

2026年1月21日

定义 AI 时代消息引擎,ApacheRocketMQ 荣获 InfoQ“2025 AI 开源明星项目”
12 月 19 日,由 InfoQ 极客传媒与模力工场联合发起的“2025 中国技术力量榜单”评选结果正式揭晓,Apache RocketMQ 凭借其在 AI 时代的创新性突破——面向 AI 应用的事件驱动架构解决方案,从众多参选项目中脱颖而出,成功斩获“AI 开源明星项目”权威奖项。该奖项标志着业界对 Apache RocketMQ 从传统消息中间件向 AI 时代消息引擎演进的技术领导力与行业影响力的高度认可。 随着 AI 技术重塑应用架构,传统的“服务连接”模式正向“智能协同”跃迁,对底层通信基础设施提出了前所未有的挑战。为精准应对这一范式转变,Apache RocketMQ 前瞻性地完成了战略升级,进化为专为 AI 时代打造的消息引擎。其以轻量级通信模型 LiteTopic 为核心的创新特性,为海量长时会话(Session)、多智能体(MultiAgent)系统及大规模 AI 任务调度等场景提供了高效、可靠的事件驱动架构解决方案。 Apache RocketMQ for AI 核心价值解读 1. 多智能体异步通信,破解协同难题 针对多智能体应用中普遍存在的长耗时调用阻塞和协作扩展性问题,RocketMQ 的 LiteTopic 模型以其百万级轻量资源创建、自动化生命周期管理、细粒度订阅管理及顺序性保障,为 Agent 之间提供了高效、有序的异步通信机制。 2. 智能任务调度,最大化 AI 算力价值 面对稀缺的 AI 算力,Apache RocketMQ 作为前端请求与后端算力服务之间的缓冲层,通过流量整形平滑请求洪峰,通过消息优先级将宝贵算力优先分配给高价值任务,并通过消费者限流保障核心服务的稳定性,实现算力价值最大化。 3. 无状态、高可靠的分布式会话管理 Apache RocketMQ 动态为每个会话创建专属队列(LiteTopic),以连续消息流完整保存上下文,从而实现上层应用的“无状态化”,极大简化开发。通过顺序保障与排他消费机制,它能严格确保会话上下文的完整性与一致性,并以极低成本实现了生产级的会话续传与恢复,同时原生支持 AI 场景下的大规模数据负载传输。 目前,Apache RocketMQ for AI 的核心特性已在阿里云云消息队列 RocketMQ 版产品中发布,并在阿里巴巴集团内部,以及阿里云大模型服务平台百炼、通义灵码等产品中经过了大规模生产环境验证,展现出卓越的成熟度与可靠性。 值得一提的是,Apache RocketMQ 与本次同获“AI 开源明星项目”的阿里巴巴开源智能体开发框架 AgentScope 深度集成,联合打造企业级、高可靠的 A2A(AgenttoAgent)智能体通信基座,为开发者构建复杂多智能体应用提供了开箱即用的解决方案。 我们相信,开放与协作是推动 AI 技术普惠的基石。Apache RocketMQ for AI 的部分核心代码已在社区开源,我们诚邀全球开发者体验、交流与共建。 + 项目地址:基于 RocketMQ 实现的 A2A 通信 RocketMQTransport 部分代码现已开源 https://github.com/apache/rocketmqa2a + 免费体验:“通过 RocketMQ 实现多智能体异步通信” https://www.aliyun.com/solution/techsolution/rocketmqformultiagentcommunication + 社区交流:欢迎钉钉扫码或搜索群号 110085036316,加入 RocketMQ for AI 用户交流群。 展望未来,Apache RocketMQ 社区将持续深耕 AI 领域,与更多生态伙伴携手,共建智能时代的数字新基建,并将更多经过验证的优秀方案回馈给开源社区。
查看全部文章
ABOUT US
Apache RocketMQ事件驱动架构全景图
微服务
Higress
Dubbo
Sentinel
Seata
Spring Cloud
Nacos
物联网
家电
汽车
穿戴设备
充电桩
工业设备
手机
事件驱动架构平台
RabbitMQ
Kafka
EventBridge
MQTT
RocketMQ
MNS
Apache RocketMQ as Core
计算
模型服务
函数计算
容器
存储
对象存储
数据库
NoSQL
分析
Flink
Spark
Elastic Search
事件
云服务器
对象存储
云监控
SaaS事件
通知
语音
短信
邮箱
移动推送

产品特点

为什么学习Apache RocketMQ

云原生
生于云,长于云,无限弹性扩缩,K8S 友好
高吞吐
万亿级吞吐保证,同时满足微服务于大数据场景
流处理
提供轻量、高扩展、高性能和丰富功能的流计算引擎
金融级
金融级的稳定性,广泛用于交易核心链路
架构极简
零外部依赖,Shared-nothing 架构
生态友好
无缝对接微服务、实时计算、数据湖等周边生态
浙ICP备12022327号-1120