在上一则贴文Gooseeker截取新浪网影片榜单-爱情片中,我向我们撷取了怎样banlist新浪网榜单-爱情片那个类别中打分在前10%的影片。

这篇贴文将是对上首诗的进一步深入细致,主要就如是说怎样将其他进行分类中列在前10%的影片一起截取下来。

其实,那个操作方式比较单纯,只需要在上篇贴文建立的准则上加进两个条件就能了。即在DS全大本机,滑鼠点选主轴—管理蛛丝马迹—加进,按提示信息,将URL邮箱依序加进进去方可。

自动草稿

但,最大的问题是,怎样以获取URL?在这儿,假如进行分类邮箱只有29个,如若还能用全自动分页的方式以获取;但假如今天他们期望以获取的邮箱重要信息有成千上万个,全自动以获取得耗费啥时间啊~

接下去我就教我们两个单纯的方式,用那个配套措施,他们能更慢更精确的以获取到邮箱重要信息。

我在以后的该文中已经说到,URL邮箱的组成都有它的规律性,大部份的页面重要信息都有它们的HTML源码。

只要稍加检视,就无从发现,新浪网进行分类榜单的邮箱的发生变动主要就分散在右图标示的nametype下面:

自动草稿

那时,在新浪网影片榜单那个页面中,点选F12,移出页面源码,点选右图黄色圆锥框选的按键,加速的功能定位到进行分类邮箱所处的边线。

如图由此可知,每一span特性下放置着两个href特性,里头包涵了他们需先的进行分类中文名称name和类别标识符type:

自动草稿

那时选上大部份进行分类特性所处的上二级特性

,滑鼠优先选择copy—copyelement:

自动草稿

接下去,关上Excel,将内容Ctrl V黏贴进去。

在这儿,我主要就通过Ctrl H替换的方式,将重复且多余的内容一一替除,然后全自动删除了小部分重要信息冗杂部分;最后用数据—分列的方式将依然不能删除的多余重要信息分列出去,并删除。经过删减,最后得到了如右图所示的B列;

最后,用公式=$A$1

1.本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2.分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3.不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4.本站提供的源码、模板、插件等其他资源,都不包含技术服务请大家谅解!
5.如有链接无法下载或失效,请联系管理员处理!
6.本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!