网络消费者购买行为分析
引言
如今电商蓬勃发展,产生大量的购物信息,如何利用这些购物信息为消费者提供更良好的购物体验成了亟待解决的问题。本文将对该数据集进行数据挖掘,找到其潜在关联规则。
数据采集
本次分析使用了阿里云天池的电商用户行为数据集。
第一部分是用户在商品全集上的移动端行为数据(D),表名为 tianchi_fresh_comp_train_user
,包含字段如下表所示:
如今电商蓬勃发展,产生大量的购物信息,如何利用这些购物信息为消费者提供更良好的购物体验成了亟待解决的问题。本文将对该数据集进行数据挖掘,找到其潜在关联规则。
本次分析使用了阿里云天池的电商用户行为数据集。
第一部分是用户在商品全集上的移动端行为数据(D),表名为 tianchi_fresh_comp_train_user
,包含字段如下表所示:
老王表示自己摆摊卖手抓饼比在公司上班的小明挣的10000元挣得多。那么小明要不要跳槽呢?
收入水平并不能作为就业的单一决策变量,还有很多隐形变量需要参考。尽管收入水平和生活质量呈现正相关,但该指标可能并不适用于所有人。下面将通过尽可能多的方面来完成对该事件的决策。
通过在淘宝上的查询,初始成本大概能涵盖如下部分。
购置项 | 费用 | 购置数量 | 备注 | 总计 |
---|---|---|---|---|
车辆 | 6488元 | 1 | 已经进行改装,短期一次性投资 | 6488元 |
炉具 | 268元 | 1 | 短期一次性投资 | 268元 |
燃气 | 114元 | 2 | 一月大约两瓶,具体用量和经营状况有关 | 228元 |
食材 | 200元 | 1 | 一晚上食材费用 | 200元 |
餐具 | 56元 | 1 | 32元8000个生物可降解塑料袋、 24元300张油膜袋子 |
56元 |
总计 | 7240元 |
最初起源于项目里的docker-compose.yml
文件, github先上传了一份脱敏的docker-compose.yml
, 然后我本地调试也需要用到这个同名的文件, 我会在其中填写token等环境变量来运行项目, 如果每次上传github都不选择这个文件的改动就对强迫症非常不友好, 或者用这个文件的别名, 使用docker compose up --conf xxx.yml
来跑.
这个问题可以用git来解决, 在把docker-compose.yml
模板上传到github上后, 运行下述代码可以让git忽略本地对此文件的修改的变化.
首先可以看下内核
dmesg
这里发现的是里面挂载了一个nfs目录, 但是该nfs目录已经失效, 也就是访问的时候timeout了, 所以没能成功访问
给域名上证书签名提高流量的安全性, 也能减少打开网站时提示不安全影响浏览体验, 但是通过常规的方式如通过小马哥家的证书签名有配额限制, 而且销毁了也不减少签发额度.
这个时候就需要用到一些其他的工具, 使用OneinStack可以方便地对服务器的基础服务进行部署, 如 nginx
, mysql
, mongodb
...
Hive 的使用需要依赖MySQL, 这里使用了mariadb来作为MySQL, 它是兼容MySQL的.
docker pull mariadb
docker配置hadoop系统环境
首先需要借助steam来启动原神,可以在库里添加原神游戏,默认能直接扫到,扫不到可以去原神安装目录里选择Yuanshen.exe来添加
有了steam后还需要一个软件,项目地址在这https://github.com/Davidobot/BetterJoy ,在右侧Releases中下载对应版本,下载后是个压缩包,解压后如下图
创建一个名字为 nahida
, IP为 192.168.60.20
, 内部网络为 misaka
, 将 3006
端口映射到宿主机的 11027
端口, 其root用户密码为 123456
的MySQL数据库容器.
docker run -itd --name nahida --net misaka --ip 192.168.60.20 -p 11027:3006 -e MYSQL_ROOT_PASSWORD=123456 mysql:latest
在之前的hadoop配置基础上, 现在来做一个上传文件到hadoop系统的java程序