网站用户行为分析

2021-01-02 17:28

阅读:731

标签:load   省份   服务   sql   mit   http   数据仓库   day   准备   

网站用户行为分析

  1. 步骤

1.1 本地数据集上传到数据仓库Hive

  1. 数据集下载与查看
  2. 数据集预处理
  3. 把数据集导入HDFS中
  4. 在Hive上创建数据库

1.2 Hive数据分析

  1. 给出数据分析需求
  2. 用select语句实现数据分析
  3. 数据分析结果查看与保存 

1.3 Hive、MySQL、HBase数据互导

 

  1. 操作过程

2.1 数据准备

第一步,通过samba服务共享文件

技术图片

 

 

技术图片

第二步,数据下载预处理

技术图片

第三步,将数据上传至hdfs

技术图片

第四步,在hive上创建数据库和表

技术图片

第五步,查看创建表的数据类型与信息

技术图片

2.2 Hive数据分析

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

    分析步骤

  • 语句:select count(*) from bigdata_user where visit_date >‘2014-12-10‘ and visit_date
  • 结果截图:运行或存为表格后的查询显示
  • 技术图片

(2)用户行为分析需求:分析每月1-31号购买情况

  • 语句:select day(visit_date) from bigdata_user limit 10;
  • 行为日期
  • 技术图片

     

     

  • 购买行为的记录数、不同用户数
  • 语句:select count(distinct uid) from bigdata_user where behavior_type=‘4’;技术图片

     

     

  • 按日期统计记录数、用户数
  • 语句:select count(distinct uid),day(visit_date) from bigdata_user where behavior_type=‘4‘ group by day(visit_date) limit 10;
    技术图片

     

     

  • 语句:select count(*),day(visit_date) from bigdata_user where behavior_type=‘4‘ group by day(visit_date) limit 10;
    技术图片

     

     

  • 保存为表格
  • 语句:create table day_count as select count(*),day(visit_date) from bigdata_user where behavior_type=‘4‘ group by day(visit_date);技术图片

     

    语句:create table day_uid as select count(distinct uid),day(visit_date) from bigdata_user where behavior_type=‘4‘ group by day(visit_date);

  • 技术图片

     

     

  • 12号+购买行为
  • 语句:select * from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-12‘ limit 10;
  • 技术图片

     

     

  • 按用户编号分组
  • 语句:select uid from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-12‘ group by uid limit 10;
  • 技术图片

     

     

  • 按用户分组统计
  • 语句:select uid,count(*) from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-12‘ group by uid limit 10;
  • 技术图片

     

     

  • 12号,购买,4项以上
  • 语句:select uid,count(*) from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-12‘ group by uid having count(*)>4 limit 10;
    技术图片

     

     

  • 语句:select uid,count(*) from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-12‘ group by uid having count(behavior_type=‘4‘)>4 limit 10;
  • 技术图片

     

     

  • 2014-12-12号当天广东购买商品数
  • 语句:select count(*)from bigdata_user where visit_date=‘2014-12-12‘ and province=‘广东‘;
  • 技术图片
  • 按省份统计购买数量

  • 语句:select count(*)from bigdata_user group by province;
  • 技术图片

    技术图片

     

     

  • 2014-12-12号当天的商品购买与浏览比例
  • 语句:select count(*)from bigdata_user where visit_date=‘2014-12-12‘ and behavior_type=‘4‘ limit 10;
  • 技术图片

     

     

  • 用户10001082在2014-12-12号当天活跃度:该用户点击行为占该天所有点击行为的比例

  • 语句:select count(*)from bigdata_user where visit_date=‘2014-12-12‘ and uid=‘10001082‘;
  • 技术图片

    技术图片

     

     

  • 2014-12-12号当天购买4件商品以上的用户
  • 语句:select uid,count(*)from bigdata_user where behavior_type=‘4‘ and visit_date=‘2014-12-12‘ group by uid having count(*)>4;
  • 技术图片

    技术图片

     

     

(3)自定义需求:

12月10号买了超过四种商品的用户id

语句:select uid from bigdata_user where behavior_type=‘4‘ and visit_date=‘2014-12-10‘ group by uid having count(behavior_type=‘4‘)>5;

技术图片

 

10号,购买,3项以上

 

 语句:select uid,count(*) from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-10‘ group by uid having count(*)>3 limit 10;

技术图片

 

 

通国际当天购买商品钟类为3的天数,并保存到表中

语句:create table day_count_3 as select count(*),day(visit_date) from bigdata_user where behavior_type=‘3‘ group by day(visit_date);

技术图片

 

网站用户行为分析

标签:load   省份   服务   sql   mit   http   数据仓库   day   准备   

原文地址:https://www.cnblogs.com/K30236/p/14209196.html


评论


亲,登录后才可以留言!