微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

大数据高质量文章汇总

大数据面试题(完整)

2020大数据面试题真题总结(附答案):点击这里

技术栈

Hadoop

万亿数据下 Hadoop 的核心竞争力:点击这里

HBase

HBase应用与高可用实践:点击这里

Kafka

基于 Kafka 的实时计算引擎如何选择?Spark or Flink ?:点击这里

Kafka 应用实践与生态集成:点击这里

Druid

深入分析Druid存储结构:点击这里

Kylin、Druid、ClickHouse核心技术对比:点击这里

ClickHouse

ClickHouse的核心特性及架构:点击这里

Phoenix

从理解 Phoenix 索引源码开始,构建全文索引:点击这里

用户画像

用户画像基础:点击这里

用户,绕不开画像:点击这里

用户画像技术及方法论:点击这里

用户画像:点击这里

数据中台

关于数据中台的深度思考与总结:点击这里

各大厂大数据应用实践

美团

美团外卖流量数据的采集加工和应用:点击这里

美团外卖实时数仓建设实践:点击这里

美团外卖离线数仓建设实践:点击这里

美团 Flink 实时数仓应用经验分享点击这里

Druid sql和Security美团点评的实践:点击这里

阿里

菜鸟实时数仓2.0进阶之路:点击这里

Flink1.11+Hive批流一体数仓:点击这里

阿里巴巴电商搜索推荐实时数仓演进之路:点击这里

优酷大数据OLAP技术选型:点击这里

深入分析 Flink sql 工作机制:点击这里

增强分析技术原理与实践:点击这里

菜鸟实时数仓技术架构演进:点击这里

Apache Flink OLAP引擎性能优化及应用 :点击这里

Flink如何支持特征工程、在线学习、在线预测等AI场景:点击这里

Apache Flink 与 Apache Hive 的集成 :点击这里

阿里1688实时数据工程实践:点击这里

Cassandra 在时空数据上的探索:点击这里

Cassandra 的过去、现在、未来:点击这里

优酷 DSP 广告投放系统架构实践:点击这里

解密商业化广告投放平台技术架构:点击这里

阿里巴巴双十一千万级实时监控系统技术揭秘:点击这里

云上HBase冷热分离实践:点击这里

Apache HBase的现状和发展:点击这里

快手

Flink在快手实时多维分析场景的应用:点击这里

快手 HBase 在千亿级用户特征数据分析中的应用与实践:点击这里

快手 Druid 精确去重的设计和实现:点击这里

滴滴

滴滴 Elasticsearch 集群跨版本升级与平台重构之路:点击这里

滴滴数据指标体系建设实践:点击这里

实时数仓在滴滴的落地实践:点击这里

AB实验在滴滴数据驱动中的应用:点击这里

时序数据在滴滴实时数据开发平台中的处理和应用:点击这里

Apache Flink在滴滴的应用与实践:点击这里

bilibili

bilibili 实时计算平台架构与实践:点击这里

网易

Impala在网易大数据的优化和实践::点击这里

网易数据湖探索与实践:点击这里

网易严选数仓规范与评价体系:点击这里

网易大数据用户画像实践:点击这里

网易实时数仓实践与展望:点击这里

OLAP数仓入门:基础篇:点击这里

OLAP数仓入门:进阶篇:点击这里

Apache Flink 在网易的实践:点击这里

网易在智能分析领域的应用与实践:点击这里

网易大数据体系之时序数据技术:点击这里

网易数据基础平台建设:点击这里

网易HBase实践:点击这里

基于Flink的严选实时数仓实践:点击这里

基于Impala平台打造交互查询系统:点击这里

趣头条

趣头条基于Flink+ClickHouse的实时数据分析平台:点击这里

字节跳动

Flink在字节跳动的时延和稳定性实践:点击这里

ClickHouse在字节跳动推荐和广告业务中的实时应用:点击这里

ClickHouse在字节跳动广告业务中的应用:点击这里

YARN 在字节跳动的优化与实践:点击这里

字节跳动自研强一致在线KV与表格存储实践:点击这里

字节跳动混沌工程实践总结:点击这里

字节跳动自研万亿级图数据库 & 图计算实践:点击这里

字节跳动 EB 级 HDFS 实践:点击这里

字节跳动在 Spark sql 上的核心优化实践:点击这里

爱奇艺

基于Apache Flink的爱奇艺实时计算平台建设实践:点击这里

Druid在爱奇艺的实践和技术演进:点击这里

爱奇艺在日志实时数据监控的探索与实践:点击这里

爱奇艺大数据实时分析平台的建设与实践:点击这里

爱奇艺大数据分析平台的演进之路:点击这里

爱奇艺流量反作弊的“术”与“道”:点击这里

Shopee

数仓大法好!跨境电商 Shopee 的实时数仓之路:点击这里

贝壳找房

分布式图数据库在贝壳的应用实践:点击这里

实时计算引擎在贝壳的应用与实践:点击这里

贝壳:流式数据的平台化实践与挑战:点击这里

HBase在贝壳找房的实践经验:点击这里

大数据平台从0到1之后:点击这里

微博

微博广告策略工程架构体系演进:点击这里

微博基于Flink的机器学习实践:点击这里

涛思数据

Hadoop or TDengine,如何做物联网大数据平台的选型:点击这里

架构设计:比 Hadoop 快至少10倍的物联网大数据平台:点击这里

神策数据

用户画像实践:神策标签生产引擎架构:点击这里

蚂蚁金服

蚂蚁数据分析平台的演进及数据分析方法的应用:点击这里

奇安信

柔性多模正则匹配引擎:点击这里

OPPO

OPPO 实时数仓揭秘:点击这里

OPPO大数据平台运营研发实践分享点击这里

第四范式

基于Spark的大规模推荐系统特征工程:点击这里

58同城

商业DMP数据管理平台的架构与实践:点击这里

金融数仓体系建设:点击这里

58同城 Elasticsearch 应用及平台建设实践:点击这里

基于Hadoop的58同城离线计算平台设计与实践:点击这里

基于 Flink 的实时计算平台在58同城的架构实践:点击这里

Bit Map在大数据精准营销中的应用:点击这里

58商业数仓建设实践:点击这里

VIPKID

VIPKID实时计算技术实践:点击这里

阅文集团

用户画像在阅文的探索与实践:点击这里

搜狐

数据仓库系统建设中的工作流及优化:点击这里

搜狐智能媒体数据仓库体系建设实践:点击这里

熵简科技

基于对象存储的离线大数据处理架构和应用实践:点击这里

华为

HBase RowKey与索引设计:点击这里

华为数据治理实践:点击这里

有赞

搜索引擎从0到1:点击这里

平安产险

Druid原理及产险实践:点击这里

快看漫画

大数据平台的模型思维与用户增长实践:点击这里

上海久耶

基于HBase实时数仓探索实践:点击这里

海康威视

Apache Beam 架构原理及应用实践:点击这里

Lyft

Lyft 基于 Flink 的大规模准实时数据分析平台:点击这里

腾讯

ZeroSearch:腾讯新一代搜索引擎:点击这里

360

Cassandra 在 360 的实践与改进:点击这里

ScyllaDB

通用高效的数据修复方法:Row level repair:点击这里

百度

Apache Doris : 一个开源 MPP 数据库的架构与实践:点击这里

画像在外卖智能调度的实践:点击这里

Hulu

Sophon :Hulu智能OLAP缓存层技术实践:点击这里

京东

Apache Doris在京东广告的应用实践:点击这里

小米

基于Doris的小米增长分析平台实践点击这里

小米流式平台架构演进与实践:点击这里

Procedure V2介绍:点击这里

唯品会

都在说实时数据架构,你了解多少?:点击这里

携程

携程数据库高可用架构实践:点击这里

携程实时智能检测平台实践:点击这里

携程金融大数据风控算法实践:点击这里

携程HBase实践:点击这里

陌陌

百亿数据处理实践:点击这里

PingCAP

TiDB 的 HTAP 之路:过去,现在和将来:点击这里

深入了解 TiDB sql 优化器:点击这里

人人车

举重若轻的人人车移动端数据平台:点击这里

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐