4 有用
3 下载

Twitter用户性别分类数据集

文件列表(压缩包大小 3.02M)

免费

概述

数据集介绍: 该数据集用于训练CrowdFlower AI性别预测器。要求参与者仅查看Twitter的个人资料并判断用户是男性,女性还是品牌(非个人)。 数据集包含20,000行,每个行都有一个用户名,帐户个人资料和图像,位置,甚至是链接和侧边栏颜色。

数据集内容: unitid:用户的唯一ID unitstate:观察状态 gender:男性,女性或品牌之一(用于非人类的个人资料) profile_yn:“否”在这里似乎意味着该配置文件是数据集的一部分,但是当贡献者去判断它时不可用 created:创建配置文件的日期和时间 description:用户的个人资料描述 fav_number:用户收藏的推文数 name:用户名 profileimage:个人资料图像的链接 retweet_count:用户转发(或可能转发)的次数 sidebar_color:配置文件侧边栏的颜色,以十六进制值表示 text:用户的任意一条推文的文本 tweet_coord:如果用户打开了位置信息,则坐标为字符串,格式为“ [ latitude,longitude ]” tweet_count:用户已发布的推文数量 tweet_created:创建随机tweet(在文本列中)时 tweet_id:随机tweet的tweet id tweet_location:tweet的位置,没有被特别规范化 user_timezone:用户的时区

本数据集转载自: https://www.kaggle.com/crowdflower/twitter-user-gender-classification

理工酷提示:

如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈

评论(0)

0/250