【2023BI数据分析大赛】基于GPT的AI产品分析
【2023第四届FineBI数据分析大赛】基于GPT的AI产品分析
一、选手简介
1、选手介绍
团队名称:AI智能文案先锋队
成员介绍:
Henry:互联网数据分析老兵一枚,有从0~1推动公司数字化建设的经验,善于洞察数据的业务价值。
Robin:同济大学硕士研究生一枚,比赛期间接触到公司“AI小惠”数字化项目,有志于成为一名数据分析师。
2、参赛初衷
一方面公司正在大力推广使用FineBI,希望通过比赛实践熟悉FineBI的使用方法和技巧;
另一方面也希望通过这项赛事和更多FineBI大神沟通,进行可视化作品和分析思维的激烈碰撞。
当然,还是希望自己的团队可以取得一个好成绩,丰富自己的职业履历~
二、作品介绍
1、业务背景
1.1业务背景
随着ChatGPT在网络上的爆火,越来越多的企业开始认识到大语言模型降本增效的强大生产力,便纷纷
加入到接入大语言模型的行列中。再惠从2022年年底开始研发自己的AI语言模型,将其衍生出的产品命名为
“AI小惠”,助力各条业务线为餐饮商户提供更高质量的运营解决方案。再惠产研部门基于多年来积累的文案库,
从1.0版本开始不断对“AI小惠”进行升级迭代,目前已经将其打造为各业务线个性化定制,细化到能支持不同文
案场景内容推荐的成熟AI产品,在公司层面不断推广使用,已积累大量公司内部员工用户。
1.2需求痛点
产品经理已协同公司前端后端对“AI小惠”点击、提问等行为进行埋点,形成大量用户使用埋点数据,
保存在公司数据库中,现需要数据分析部门从创建指标体系、提供数字化报表、监控“AI小惠”的使用现状
及使用效果、总结目前产品使用问题的角度,推动AI产品后续的优化。
1.3分析问题
经过与产品经理的进一步沟通,确定了本次报告的分析问题:
现状分析:分业务线、角色和文案场景的提问和采纳情况
用户划分:根据用户的使用频次、留存情况和使用满意程度进行人群划分
优化方向:是否需要优化用户的提问方式、提问场景,提升公司文案库质量等?
2、数据来源
作品使用的数据均来自企业内部数据库,已做脱敏处理;主要分为“AI小惠”埋点数据和员工组织架构两大类数据。
2.1“AI小惠”埋点数据
表名称:AI小惠用户行为埋点
字段
字段类型
含义
app
string
业务线;包括点代、外卖、私域等
event
string
用户行为;包括打开AI小惠,发送提问,复制文案等
username
string
用户姓名
userid
bigint
用户ID
createat
date
操作时间
doctype
string
文案类型(英文名)
docid
bigint
生成文案ID
表名称:提问记录表
字段
字段类型
含义
chatprocess
string
提问问题
doctype
string
文案类型(英文名)
id
string
生成文案ID
表名称:文案类型维表
字段
字段类型
含义
doctype
string
文案类型(英文名)
name
string
文案类型(中文名)
biz_sourse
string
业务线;包括点代、外卖、私域等
2.2员工组织架构数据
表名称:员工组织架构表
字段
字段类型
含义
employeeid
string
员工ID
employeename
string
员工姓名
level_two_organization
string
二级组织架构
level_three_organization
string
三级组织架构
level_four_organization
string
四级组织架构
position
string
职位名称
entryat
date
入职时间
3、分析思路
3.1维度拆解:
时间维度:年——月——周——日
用户维度:业务线——用户角色——文案场景
文案维度:长短文案——文案场景
3.2指标体系:
指标名称
计算逻辑
含义
AI小惠打开人数
统计周期内,点击AI小惠图标进入聊天界面的人数
有多少人打开过AI小惠
选择文案场景人数
统计周期内,进入AI小惠并选择了文案场景的人数
有多少人选择过文案场景
提问人数
统计周期内,点击过发送文案按钮的人数
有多少人和AI小惠对话过
提问使用率
$=提问人数/总人数
统计周期内,提问人数占比
渗透率
$=去重提问人数/总人数
截止目前使用过AI小惠的人数比例
文案采纳人数
统计周期内,复制过AI小惠回答的人数
有多少人采纳了AI小惠的回答
文案采纳率
$=文案采纳人数/提问人数
采纳AI小惠回答的人数在提问人数中的占比
3.3分析方法:
(1)基于3W2H对问题进行拆解
Who:哪些人群在用?
What:在用产品的什么功能(文案类型)?
When:什么时间在用?
How:用的情况怎么样?
How much:用的满意程度?
(2)具体方法
Top分析:找到产品使用最多的人群以及各业务线下使用最多的文案场景;采纳率最高的提问关键词等
对比分析:分维度对比提问人数、提问使用率、和文案采纳率的时间变化趋势
漏斗模型:不同时间维度下产品各使用阶段人群转化
RMF模型+波士顿矩阵分析:产品用户画像细分
关联分析:找到各业务线下的文案场景组合
3.4分析框架:
4、数据处理
4.1处理框架
4.2具体处理过程
(1)分析表-产品使用漏斗
首先分组汇总:分组字段为日期,汇总字段均为员工ID,汇总方式为去重计数,汇总条件分别设置为:
打开AI小惠次数≥1、选择文案场景次数≥1、提问次数≥1、复制文案条数≥1
然后列转行:列转行字段为打开AI小惠、选择文案场景、提问、采纳;
最后将列字段命名为“使用阶段”,值字段命名为“人数”
(2)分析表-提问&采纳情况
首先对中间表-分文案场景提问情况汇总表分类汇总:
分组字段为日期、业务线、人员类型、文案场景、长短类型,
汇总出提问人数、生成文案条数、复制文案条数
然后左右合并中间表-各业务线总人数表:左合并,合并字段为日期、业务线和人员类型
*注:提问使用率(提问人数/总人数)和文案采纳率(复制文案条数/生成文案条数)在组件中聚合计算。
(3)分析表-文案场景关联分析
我们分析的是一个员工每天使用的文案场景之间的关联,只需要用到日期、员工id和文案场景三个字段,
每个员工一天可能使用同一个文案场景多次,因此需要删除重复行;
然后就需要复制一张相同的表然后左右连接,这样就可以得到场景之间的两两组合关系;
分类汇总计数,然后注意删除前后场景相同的数据。
重点说一下第一次用到FineBI自带的def函数计算支持度(即各相关文案场景共出现次数占总次数的比值),
实现占比计算:
最后把文案场景行转列,并按照行的顺序排列,就可以得到关联矩阵的效果了:
5、可视化报告
三、参赛总结
1、FineBI工具
1.1 工具亮点:
a) 数据可视化:FineBI提供了丰富的图表类型,如折线图、柱状图、饼图、地图等,可以轻松地将数据转化为
直观的可视化报表。这有助于我们更好地理解数据,发现数据背后的规律和趋势。
b) 数据连接与整合:FineBI支持多种数据源的接入,如线下excel、关系型数据库、非关系型数据库、云数据等。
它可以轻松整合不同数据源的数据,降低了数据处理的难度。
c) 数据建模:FineBI的数据建模功能可以帮助我们创建自定义的度量和维度,方便我们在分析过程中进行数据分组、
筛选和排序。此外,它还支持创建计算字段,可以实现更复杂的数据计算需求。
d) 仪表盘:FineBI的仪表盘功能可以让我们将多个可视化报表组合在一起,形成一个统一的数据分析视图。
这有助于我们更好地展示数据分析结果,提高数据驱动决策的效率。
1.2. 不足之处:
a) 学习曲线较陡峭:FineBI的功能非常丰富,但这也意味着新用户可能需要花费较多时间来学习如何使用这个工具。
对于没有数据分析经验的用户来说,这可能会成为一个挑战。
b) 可定制性有限:虽然FineBI提供了丰富的图表类型和样式,但在一些特定的场景下,用户可能会需要更高度的
可定制性来满足特殊需求。
1.3 数据分析的价值:
数据分析在现代企业中发挥着至关重要的作用,而FineBI降低了企业员工进行数据分析的门槛。
通过FineBI对数据进行深入分析,我们可以发现潜在的规律和趋势,从而为决策提供有力支持。数据分析可以帮助
企业优化业务流程、提高工作效率,降低成本,增加收入,以及发现新的商业机会。在竞争日益激烈的市场环境中,
让各部门的决策者掌握数据分析能力,已经成为企业成功的关键因素之一。
2、参赛总结
在这次FineBI的使用过程中,我深刻地体验到了尝试、坚持和突破带给我的成长。
首先,我克服了学习FineBI的困难。在开始学习FineBI时我面临着许多挑战,如何将复杂的数据转化为直观的
可视化报表,如何处理大量的数据,如何将多个数据源整合在一起等等。为了解决这些问题,我通过FineBI
丰富的文档库,健全的培训课程,加上向同事请教,逐步掌握了FineBI的使用方法。
其次,感恩FineBI带我进入了数据分析领域。作为一名数据分析师,我现在能够通过FineBI的数据探索,
发现业务问题,为决策提供有力支持。这种工作成就感让我更加热爱我的职业,也让我在团队中得到了更多的认可。
在团队协作和参赛交流中,我也遇到了许多志同道合的小伙伴。在这个过程中,我深刻地认识到了成长的意义。
这种成长不仅仅是技能的提升,更是心的成长。每一次的尝试,每一次的坚持,每一次的突破,都是我们成长的见证。
总的来说,这次参与FineBI大赛的经历让我收获了许多。我相信,我一定能够在数据分析的道路上走得更远。