淘宝数据集解析
我们准备了一份淘宝用户行为数据集,保存为csv文件。本数据集包含了淘宝上某一天随机一百万用户的所有行为(包括点击、购买、收藏、喜欢)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:
字段名 | 数据类型 | 说明 |
---|---|---|
userId | Long | 脱敏后的用户ID |
itemId | Long | 脱敏后的商品ID |
categoryId | Int | 脱敏后的商品所属类别ID |
behavior | String | 用户行为类型,包括:('pv', 'buy', 'cart', 'fav') |
timestamp | Long | 行为发生的时间戳,单位秒 |