01
快速上手
还好,Python从不缺少第三方库,有贡献者已经帮我们造好了轮子tldextract(https://github.com/john-kurkowski/tldextract)。
安装
pip install tldextract
示例
02
再探一步
如果只是简单使用,上面的代码已经足以,我们再稍稍前进一步。
第一次提取主域名的时候,此包会访问域名后缀网站(https://publicsuffix.org/list/public_suffix_list.dat),生成一个域名后缀集合(.td_set,["ac", "com.ac", "edu.ac", "gov.ac", ... , "zip", "zippo", "zone", "zuerich"]),有了这个集合,我们就可以定期更新,离线安装使用了。
离线使用
将.tld_set文件拷贝出来,离线使用。
参考文档:https://github.com/john-kurkowski/tldextract
领取专属 10元无门槛券
私享最新 技术干货