首页 | 代码匠心

从零开始学Flink：Flink CDC 入门

先搞懂：CDC 到底是什么？

CDC，全称 Change Data Capture（变更数据捕获），说白了就是：数据库里每发生一次增删改，我都能立刻感知到，并把它变成一条实时消息发出去。

打个比方：

传统方式像是在仓库门口装了个摄像头，每隔 30 分钟回看一次录像，看看有没有货进出。
CDC 则是直接在每件货物上贴了个传感器——货一动，你手机上立刻收到通知。

Flink CDC 就是这个传感器系统里最成熟的实现方案之一。它直接读取 MySQL 的 Binlog（二进制日志）——MySQL 用来做主从复制的那个日志，相当于数据库的"行车记录仪"，每一笔增删改都被原原本本地记录在里面。

代码匠心2026/5/31大约 6 分钟

从零开始学Flink：TopN 榜单

在上一篇《从零开始学Flink：Flink SQL四大Join解析》结尾提到过，下一篇要把 窗口聚合（Window Aggregation）与 TopN 讲清楚。窗口负责把无界流切成可统计的时间片，TopN 负责把“统计结果”变成榜单输出；两者组合起来，PV/UV、订单量、热销榜、实时大屏基本都能覆盖。

但这块也最容易踩坑：SQL 明明在跑却一直没输出、TopN 结果频繁更新/撤回下游写不进去、滑动窗口一上来状态就撑爆。本文直接用可复现的 Kafka 数据流把这些问题跑出来，并给出对应的处理方式。

代码匠心2026/3/26大约 8 分钟

从零开始学Flink：Flink SQL四大Join解析

在上一篇《从零开始学Flink：实时数仓与维表时态Join实战》中，我们通过引入 Hive Catalog，解决了 Flink SQL 元数据管理的痛点。

今天，我们将目光聚焦于实时数仓建设中最核心、也最容易“踩坑”的环节——多流关联（Join）。

作为一名大数据工程师，你可能经常面临这样的灵魂拷问：

代码匠心2026/3/8大约 7 分钟

从零开始学Flink：Flink 双流 JOIN 实战详解

在前一篇《Flink SQL 窗口(Window)操作详解》中，我们已经打好了时间与窗口的基础。
但在真实业务里，单条流上的聚合往往只是第一步，更常见的需求是把多条业务流关联起来一起看，例如：

订单流 + 支付流：衡量下单到付款的转化效果
浏览流 + 下单流：分析从曝光、点击到下单的完整漏斗
用户行为流 + 用户画像维表：驱动推荐、风控等在线决策

代码匠心2026/3/3大约 7 分钟

AI 自动编程：一句话设计高颜值博客

在 AI-Native 时代，开发者的角色正在从“代码编写者”向“架构设计者”转变。Claude Code 作为 Anthropic 推出的下一代命令行 AI 助手，不仅仅是一个代码补全工具，更是一个具备 Agentic Workflow（代理工作流）能力的智能终端。

本文将深入探讨如何部署 Claude Code 环境，并结合社区强大的 frontend-design Skills，实现从自然语言指令到现代化前端页面的“零代码”构建。

1. 前置环境要求 (Prerequisites)

Claude Code 依赖 Node.js 运行时环境。在开始部署之前，请确保您的开发环境满足以下要求：

代码匠心2026/2/28大约 5 分钟

从零开始学Flink：Flink SQL 元数据持久化实战

在上一篇《从零开始学Flink：实时数仓与维表时态Join实战》中，我们通过「订单事实流 + 用户维表」构建了一条基础的实时数仓链路。

但在实际操作 Flink SQL Client 时，你可能已经痛感到了一个问题：

痛点：会话窗口一旦关闭，或者 Flink 集群重启，辛辛苦苦编写的 CREATE TABLE、CREATE VIEW 等 DDL 语句瞬间“归零”。每次调试都需要从头再来，重复建表。

代码匠心2026/2/25大约 12 分钟

从零开始学Flink：实时数仓与维表时态Join实战

在前一篇《Flink 双流 JOIN 实战详解》中，我们用「订单流 + 支付流」搞懂了事实双流之间的时间关联。

但在真实的实时数仓项目里，光有事实流还不够，业务同学更关心的是：

下单用户是新客还是老客
用户当前的等级、城市、渠道
商品所属品类、类目层级

代码匠心2026/2/17大约 9 分钟

从零开始学Flink：Flink SQL 窗口(Window)操作详解

在上一篇 Flink SQL 极简入门中，我们体验了 Flink SQL 的基础用法。但在流处理中，最核心、最迷人（也最让人头秃）的概念莫过于**“时间”和“窗口（Window）”**。

你可能经常听到这样的业务需求：

“每 5 分钟统计一次订单总量”
“实时统计过去 1 小时内的热门商品，每 10 秒更新一次”
“每天 0 点到当前时刻的累计 PV”

代码匠心2026/2/9大约 5 分钟

从零开始学Flink：Flink SQL 极简入门

Flink SQL 是 Apache Flink 的核心模块之一，它让开发者可以使用标准的 SQL 语法来编写流处理和批处理作业。对于不想深究 Java/Scala 复杂 API 的“小白”来说，Flink SQL 是进入实时计算领域的最佳敲门砖。

本文将基于 Flink 1.20.1 版本，手把手教你在 WSL2 (Ubuntu) 环境下搭建环境，并运行你的第一个 Flink SQL 任务。

一、为什么选择 Flink SQL？

低门槛：会写 SQL 就能开发实时任务。
统一性：批流一体，同一套 SQL 既可以跑历史数据（批），也可以跑实时数据（流）。
生态丰富：内置了大量的 Connector（连接器），轻松连接 Kafka、MySQL、Hive 等主流组件。

代码匠心2026/2/6大约 4 分钟

Trae IDE 隐藏玩法：接入即梦 AI，生成高质量大片！

想用 AI 生成电影级画质的美图，却被高昂的订阅费劝退？

在 AI 绘图领域，字节跳动的 即梦 (Jimeng) 凭借其对中文的深度理解和惊艳的画面质感，迅速出圈。

今天，我们将解锁 Trae IDE 的隐藏技能——结合开源神器 jimeng-api，从零打造一个专属的 AI 绘图技能。无需复杂的代码，只需简单的配置，你的 IDE 就能变身“神笔马良”，免费生成高质量大片！

🛠️ 一、准备工作：部署 API 服务

代码匠心2026/2/5大约 3 分钟