零基础学机器学习作者黄佳作品,有趣且有料,培养数据分析思维,理论与实际相结合!赠送全书实例源代码!
◎编辑推荐:
1.强调知识技能与具体业务的结合,总结的都是工作中的实际操作经验。与理论书相比,本书强调动手,而不仅是思维认知;与技术书对比,本书不仅从技术角度介绍了数据采集、清洗、分析的相关工具与方法论,而且对其在运营和增长方面的业务应用也进行了体系化的介绍。
2.本书以课程对话、答疑和练习的形式呈现,语言轻松幽默,有着非常好的区分度和辨识度。
3.以AARRR模型为线索展开,以问题为导向,总结运营增长中各个核心关键点的具体数据分析与实践,重在培养读者的数据分析的能力和思维。
4.作者为新加坡埃森哲公司高级顾问,参与过公共事业、医疗、金融等多领域大型人工智能项目,长期聚焦于对大型数据的分析与增长,对政府、企业和事业单位的数据智能化项目如何成功落地有着丰富的经验。
◎内容简介:
本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。
本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需求的人士阅读,也适合相关专业的师生阅读。
......(更多)
黄佳,笔名:咖哥,人工智能研究员,终身学习者。在IT界耕耘二十载,曾撰写《SAP程序设计》和《零基础学机器学习》等书。近期参与的项目:使用机器学习和数据分析技术精准定位客户群体、食品质谱数据中有效成分的分析与鉴定、医学视觉图像数据分析、针对青少年压力问题的聊天对话机器人的自然语言处理等。在科研和学习过程中每有收获,便记录好每一个从不懂到懂的过程和细节,期待着与大家分享。
......(更多)
引子 小雪求职记
基础篇 数据分析师的锦囊
一、欲善其事先利器:数据分析技能进阶图谱
二、深入业务寻价值:价值源于深度理解场景
三、积跬步以察千里:数据的采集与治理
四、沥尽狂沙方见金:数据的清洗与可视化
五、营运之道无定法:数据分析的核心方法
六、增长践行成于思:数据分析的关键思维
实践篇 数据运营分析十话
卷一 获客
第一话 横看成岭侧成峰:用户画像揭示秘密
1.1 问题:这款推广海报好不好
1.2 概念:用户画像
1.3 工具: Python 数据分析编程基础
1.3.1 Python 的极简说明
1.3.2 Python 中的序列数据类型
1.3.3 数学计算工具包 NumPy
1.3.4 数据处理工具包 Pandas
1.3.5 数据可视化工具包 Matplotlib和Seaborn
1.4 实战:哪一类人才是真正的买家
1.4.1 数据读入及简单分析
1.4.2 用户整体画像
1.4.3 购买眼影盘用户的画像
1.5 结论
第二话 远近高低各不同:聚类实现RMF细分
2.1 问题:如何通过细分用户指导运营
2.2 概念:用户细分
2.2.1 用户画像是了解用户的第一步
2.2.2 用用户行为数据指导精细化运营
2.2.3 进行同期群分析揭示获客时的秘密
2.2.4 根据特征和价值进行用户分组
2.3 工具:RFM 分析和聚类算法
2.3.1 RFM 分析
2.3.2 聚类算法
2.4 实战:基于 RFM 模型的用户细分
2.4.1 整体思路
2.4.2 数据读入和可视化
2.4.3 根据 R 值为用户新近度分层
2.4.4 根据 F 值为用户消费频率分层
2.4.5 根据 M 值为用户消费金额分层
2.4.6 汇总 3 个维度,确定用户价值分层
2.5 结论
2.6 彩蛋:看看谁是最有价值的用户
113
第三话 获客成本何其高:回归预测用户 LTV
3.1 问题:我能从用户身上赚多少钱
3.2 概念:用户生命周期价值
3.3 工具:回归分析
3.3.1 机器学习中的回归分析
3.3.2 训练集、验证集和测试集
3.3.3 如何将预测的损失最小化
3.4 实战:预测电商用户的生命周期价值
3.4.1 整体思路
3.4.2 数据读入和数据清洗
3.4.3 构建机器学习数据集
3.4.4 预测未来一年的 LTV
3.5 结论
3.6 彩蛋:还有哪些机器学习算法
卷二 激活
第四话 百川争流终归海:动态归因优化渠道
4.1 问题:哪个渠道最给力
4.2 概念:渠道分析和归因模型
4.2.1 渠道和渠道分析
4.2.2 归因和归因模型
4.3 工具:马尔可夫链归因模型
4.3.1 记录推广路径
4.3.2 显示用户旅程
4.3.3 统计状态间的转换概率
4.3.4 计算整体激活率
4.3.5 计算移除效应系数
4.4 实战:通过马尔可夫链模型来计算渠道价值
4.4.1 整体思路
4.4.2 构建每一个用户的旅程
4.4.3 根据状态构建通道字典
4.4.4 计算状态间的转换概率
4.4.5 计算渠道移除效应系数
4.5 结论
4.6 彩蛋 :夏普利值归因
第五话
营销贵在激活时:漏斗模型聚焦转化
5.1 问题:促销活动中的哪个环节需优化
5.2 概念:漏斗和转化率
5.3 工具:Plotly 包中的漏斗图
5.4 实战:通过漏斗分析看促销效果
5.4.1 整体思路
5.4.2 数据导入
5.4.3 基本漏斗图
5.4.4 细分漏斗图
5.5 结论
第九话 君向潇湘我向秦:用 A/B 测试助力促销
9.1 问题:两个页面,哪个更好
9.2 概念:A/B 测试
9.2.1 确认实验目标
9.2.2 设计实验
9.2.3 实验上线与监控
9.2.4 结果复盘
9.3 工具:统计学知识
9.3.1 对照实验
9.3.2 假设检验
9.3.3 样本的数量
9.4 实战:通过 A/B 测试找到最佳页面
9.4.1 整体思路
9.4.2 数据导入与数据可视化
9.4.3 查看转化率的增量
9.4.4 检验测试结果的统计学意义
9.4.5 细分样本后重新检验
9.5 结论
卷五 自传播循环
第十话 一二三生千万物:裂变驱动增长循环
10.1 问题:哪种裂变方案更有效
10.2 概念:增长黑客和裂变
10.2.1 增长黑客的本质
10.2.2 各种各样的裂变
10.3 工具:增长模型
10.4 实战:用增长实验确定最佳折扣方案
10.4.1 整体思路
10.4.2 数据导入及数据可视化
10.4.3 比较两种裂变方案带来的转化率增量
10.4.4 用 XGBoost 判断特定用户的分类概率
10.4.5 比较两种裂变带来的转化增量
10.5 结论
寄语
......(更多)
......(更多)