跳到正文
全部标签

# 知识库

共 108 篇文章

  • 技术选型横评:计算引擎篇(Spark vs Flink vs Presto/Trino) PRO

    技术选型横评:计算引擎篇(Spark vs Flink vs Presto/Trino)

    面向初中级数据从业者的计算引擎选型指南,系统对比 Spark、Flink、Presto/Trino 的设计理念、性能特点、适用场景与学习曲线,帮你在批处理、实时流处理、交互式查询三大场景做出正确决策。
  • 给不同阶段学习者的真诚建议

    给不同阶段学习者的真诚建议

    针对5类不同阶段数据从业者的个性化学习建议:零基础探索者该从SQL还是Python开始?在校生如何准备第一份数据实习?1-3年从业者怎么突破取数工具人瓶颈?资深专家如何保持技术竞争力?求职者如何高效备战面试?每个阶段都有具体可执行的行动清单。
  • 从字节跳动SQL面试题看数据思维:如何用中间表设计优雅解决亿级数据问题 PRO

    从字节跳动SQL面试题看数据思维:如何用中间表设计优雅解决亿级数据问题

    一道字节跳动SQL面试题,看似考聚合查询,实际考察的是数据仓库分层设计能力——特别是中间表(DWS层)的设计思维。面试不是考SQL语法,而是考你在生产环境中处理亿级数据的经验。本文从初级解法到专家解法逐层拆解,展示面试官真正想看到的数据思维。
  • 数据架构师 L4:技术领导力

    数据架构师 L4:技术领导力

    数据架构领域专家成长指南:从技术执行者到技术战略制定者的角色转变。涵盖企业级数据架构治理、技术领导力建设、架构创新驱动和跨团队协作4大核心能力,帮助5年以上数据架构师建立行业影响力,引领组织的数据技术方向。
  • 技术选型横评:数据湖格式篇(Hudi vs Iceberg vs Paimon)

    技术选型横评:数据湖格式篇(Hudi vs Iceberg vs Paimon)

    面向初中级数据从业者的数据湖表格式选型指南,深度对比 Apache Hudi、Apache Iceberg、Apache Paimon 的设计理念、核心特性与适用场景,附国内大厂采用现状与完整决策树。
  • 你公司的数据系统,已经没有人能完全看懂了 PRO

    你公司的数据系统,已经没有人能完全看懂了

    数据地基系列第二篇:你公司的数据系统跑了七八年,中间换过三拨人,现在连一条「昨天的订单转化率」从埋点到报表经过了几道手都说不清。这不是个例,而是中大型公司的常态。本文剖析数据系统「熵增」的根本原因,以及为什么没有人能完整画出数据流全貌。
  • 市场经理与产品经理如何构建电商指标体系以提升利润率和用户留存

    市场经理与产品经理如何构建电商指标体系以提升利润率和用户留存

    市场经理、产品经理、财务经理在电商场景中常因指标不统一导致决策分歧:获客成本涨25%、留存率无提升、利润率下降。本文提供SMART原则、三层指标分层(战略/战术/操作)及平衡方法,帮助数据分析师和业务负责人快速搭建可诊断、可归因的指标体系。
  • 数据架构师 L3:架构设计

    数据架构师 L3:架构设计

    资深数据架构师进阶路线:掌握复杂业务场景下的架构设计、湖仓一体架构演进、跨系统数据流优化和架构评审方法论。面向3-5年数据架构从业者,提供从单一系统设计到企业级架构规划的能力跃迁路径,附大厂真实架构案例拆解。
  • 数据治理工程师 L3:治理体系

    数据治理工程师 L3:治理体系

    资深数据治理专家进阶路线:建立企业级数据治理体系,推动数据资产管理、数据安全合规和数据血缘追踪3大核心能力落地。面向3-5年数据治理从业者,提供从单点治理到全局体系化的能力跃迁路径,附治理成熟度评估模型和真实企业案例。
  • 如何用AI工具加速求职

    如何用AI工具加速求职

    用AI优化简历、分析JD、模拟面试——这些都是合理且有效的。但让AI凭空编造你没做过的项目,面试一轮就会穿帮。本文提供5个真实有用的AI求职应用场景,附可直接使用的Prompt模板。
  • 数据分析师薪酬谈判技巧:价值变现指南 PRO

    数据分析师薪酬谈判技巧:价值变现指南

    薪酬谈判不是一次对话,而是系统性的价值展示过程。本文提供数据分析师薪酬谈判的完整方法论:市场薪资调研工具与数据源、价值量化话术框架(用业务结果而非技术栈说话)、锚定效应与让步策略,帮助数据从业者在Offer谈判中争取合理的薪资回报。
  • 数据分析师 L4:领域领航

    数据分析师 L4:领域领航

    5年以上数据分析专家成长指南:从个人贡献者到组织赋能者的关键跃迁。涵盖数据战略规划、分析团队搭建与管理、AI时代领导力建设3大核心模块,帮助资深分析师解决「技术已经很强但影响力有限」的L4阶段典型困惑,找到技术专家或管理者的长期发展方向。
  • 学习路线图使用指南

    学习路线图使用指南

    数据领域全栈学习路线图使用指南:覆盖数据分析师(L1-L4)和数据开发工程师(L1-L4)的全生命周期成长路径。从SQL/Python入门到架构设计、团队管理,每个阶段都有明确的技能要求和学习资源,帮助你根据当前水平和目标岗位找到最适合的学习路径。
  • 数据开发 L2:核心构建

    数据开发 L2:核心构建

    1-3年数据开发工程师核心能力构建路线:从Hive SQL到Spark分布式计算,掌握维度建模、数仓分层(ODS/DWD/DWS/ADS)、ETL开发和数据倾斜调优4大核心技能。解决「SQL写得好但Hive跑不动」「只会写代码不会设计模型」的L2阶段典型问题。
  • 数据分析师与风控工程师如何用AI提升金融风控效率:审批提速至秒级、欺诈识别率+30%

    数据分析师与风控工程师如何用AI提升金融风控效率:审批提速至秒级、欺诈识别率+30%

    面向数据分析师、风控工程师及金融科技从业者,详解AI在信贷风控、反欺诈、反洗钱(AML)中的落地方法:信用评分模型、图神经网络识别团伙欺诈、实时预警模型部署,实测审批时效从天级降至秒级,欺诈识别率提升30%以上。
  • 技术选型横评:调度系统篇(Airflow vs DolphinScheduler vs XXL-Job vs Azkaban)

    技术选型横评:调度系统篇(Airflow vs DolphinScheduler vs XXL-Job vs Azkaban)

    面向初中级数据从业者的工作流调度系统选型指南,深度对比 Airflow、DolphinScheduler、XXL-Job、Azkaban 的架构设计、DAG 定义方式、高可用方案与易用性,附典型企业采用现状与完整决策树。
  • 技术很强却总被忽视?L3 数据分析师的真正瓶颈

    技术很强却总被忽视?L3 数据分析师的真正瓶颈

    机器学习模型跑得再溜、AB测试做得再规范,为什么你的分析建议总是「被参考」后石沉大海?本文用注意力经济学和价值创造系统两个模型,拆解3-5年L3数据分析师最容易被忽视的真相:在组织里技术能力是1X,影响力才是10X的放大器。
  • 数据分析师 L3:高级专家

    数据分析师 L3:高级专家

    3-5年资深数据分析师进阶路线:掌握机器学习建模(用户流失预测、LTV预估)、A/B测试实验设计、因果推断3大高阶技能,从解决单个问题到建立公司级分析体系。面对「日常工作得心应手但成长停滞」的L3瓶颈,提供专家方向和管理方向的双路径选择指南。
  • 数据开发 L3:架构演进

    数据开发 L3:架构演进

    3-5年资深数据工程师进阶路线:从离线数仓到实时计算(Flink SQL/Kafka),掌握平台架构设计、Spark深度调优、流批一体和数据治理4大核心能力。解决「业务要实时但只会离线」「Spark任务越调越慢」的L3阶段典型瓶颈,帮你完成从熟练开发者到数据架构师的关键跃迁。
  • 数据分析师如何掌握NLP基础:理解文本、生成内容与构建AI应用

    数据分析师如何掌握NLP基础:理解文本、生成内容与构建AI应用

    面向数据分析师、AI产品经理和初级算法工程师的NLP入门指南。覆盖文本分类、情感分析、NER、机器翻译等8大核心任务,含3类模型对比、4种摘要方法、5个行业落地场景(客服/金融/医疗/电商/政务),准确率提升30%+的实践路径。
  • 数据开发 L4:技术战略

    数据开发 L4:技术战略

    5年以上数据技术领导者成长指南:从「解决问题」到「定义问题」的角色转变。掌握云原生架构规划、DataOps体系建设、技术选型决策和团队效能管理4大核心模块,帮助资深数据工程师解决「技术很强但影响力有限」的L4阶段困惑,建立技术战略视野。