淘宝数据集解析

我们准备了一份淘宝用户行为数据集,保存为csv文件。本数据集包含了淘宝上某一天随机一百万用户的所有行为(包括点击、购买、收藏、喜欢)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:

字段名数据类型说明
userIdLong脱敏后的用户ID
itemIdLong脱敏后的商品ID
categoryIdInt脱敏后的商品所属类别ID
behaviorString用户行为类型,包括:('pv', 'buy', 'cart', 'fav')
timestampLong行为发生的时间戳,单位秒