大家好,我正在尝试做一个研究项目,我试图提取所有 Twitter 用户配置文件(或至少其中一部分用户)。
通过提取此数据,我想将所有用户的简历或描述字段中包含特定单词或单词的所有用户存储在一个文件中。
这是我想出并尝试使用的代码:
import tweepy
import csv
ckey ='...'
csecret ='...'
atoken = '...'
asecret = '...'
# Attributes of a twitter user profile (this header is already on my file)
twitter_datafile_attr = ['follow_request_sent', 'profile_use_background_image', 'contributors_enabled', 'id', 'verified',
'profile_image_url_https', 'profile_sidebar_fill_color', 'profile_text_color', 'followers_count',
'profile_sidebar_border_color', 'id_str', 'default_profile_image', 'listed_count' 'is_translation_enabled',
'utc_offset', 'statuses_count', 'description', 'friends_count', 'location', 'profile_link_color',
'profile_image_url', 'notifications', 'geo_enabled', 'profile_background_color', 'profile_banner_url',
'profile_background_image_url',
'screen_name', 'lang', 'following', 'profile_background_tile', 'favourites_count', 'name', 'url', 'created_at',
'profile_background_image_url_https', 'time_zone', 'protected', 'default_profile', 'is_translator']
#Authencation
auth = tweepy.OAuthHandler(ckey,csecret)
auth.set_access_token(atoken,asecret)
api=tweepy.API(auth)
# search for people who have both the words "hawaii and "water" anywhere in their bios
user=api.search('hawaii water')
这是我卡住的地方,我尝试使用 get_user(ctr) ,其中 ctr 通过 Twitter ID 迭代到一定数量的用户。将数据处理为 csv 文件很容易,我已经为其实现了代码。
我应该只在 twitter.com 上进行手动搜索并查看源代码文件并使用正则表达式解析数据,还是有其他方法使用 tweepy 来获取与他们的 bios 中的某些词匹配的用户配置文件?
如有任何帮助,我们将不胜感激。谢谢
请您参考如下方法:
我能够自己找出答案。
您使用 api.search_users(query) 来搜索与特定查询匹配的用户名。