怎样下载Abook上的视频等文件

这学期都过去一半了,为什么现在才想起来去看Abook呢?还不是因为它太难用了。也许高等教育出版社开发这款产品的初衷是好的,但是,用“粗制滥造”来形容它不为过吧?!

官方介绍是这样的:

欢迎大家访问abook.hep.com.cn,访问相关教材配套的数字课程!
ABook是高等教育出版社为广大高校教师和学生开发的适应教育发展和出版发展要求的“新形态”的高校教材。
ABook新形态教材在教材的编写理念、内容形式、出版机制等各方面都突破了传统高校教材的模式,充分融合教师课内课外教学、学生线上线下学习的数字网络化时代教与学的需求,使学生在学习精品纸质教材的同时,方便的通过计算机网络、手机、iPad等电子终端设备,获取名师微视频、拓展阅读材料、重点难点解析、习题练习讲解等精心筛选和紧密配套的数字化资源。学生还可以在网上进行自测、答疑等互动互助式的学习。

我发现注册账号的网页有bug,图片滑动拼图验证时图片加载不出来或只加载一次,滑块滑不动,不能正常注册。我最后是在app里注册的。 视频不提供下载情有可原,但PDF文档都不能下载我就不能理解了。 下载出来的文件的文件名乱码。其实这是我的浏览器问题,Edge
Chromium内核 dev版乱码,IE正常,Chrome 正常。


我要下载的配套文件属于《数学模型(第五版)》这本书。 我所用的浏览器是 Edge Chromium内核版。我在网页上观看视频时,在视频框的右下角有一个 Download 按钮,能点开但不能下载,会提示“ Couldn’t download – No permissions
”,没有权限。直接访问视频连接,显示403 Forbidden. 但是,代码文件和excel文件是可以下载的,能够下载的文件的图标上,会显示一个箭头,点击箭头就能下载了。 文件的下载链接是这样的:

http://abook.hep.com.cn/downLoadResouce.action?resourceInfoId=5000252368&resourceUrl=5000002867/resourses/2018/3/16/544dee21-42e4-4fe7-9bfd-bfcca464eb06.xlsx

如果我把链接后半部分的文件路径替换为视频的文件路径,能不能下载视频呢(我们在上面已经获取了视频的文件路径,只不过403无法访问)?来试一试:

http://abook.hep.com.cn/downLoadResouce.action?resourceInfoId=5000252368&resourceUrl=5000002867/resourses/2018/3/22/1521701992053829766210263416081.mp4

下载的依然是那个xlsx文件。说明下载链接后半部分的字符是没有用的,删除掉试一试:

http://abook.hep.com.cn/downLoadResouce.action?resourceInfoId=5000252368

依然能够成功下载到那个xlsx格式文件。说明起作用的只是那个resourceInfoId。那么,如果我们把这串ID替换为视频对应的ID,是不是就能下载视频了呢?我们该如何获取呢? 我这时先想到的是这个问题:这串数字是不是连续的?我尝试把最后一位的8改为7,链接是能够正常访问的,下载得到一个PDF文件。说明这串数字是有规律的。 然后我发现,在我把鼠标指针放到文件上的时候,浏览器窗口的左下角会显示这串字符(其实就是一个链接):

javascript:showResource(5000252368,0);

括号里的正是我们寻求的resourceInfoId。 我惊奇的发现,把鼠标指针放到视频图标上的时候,也会显示同样的字符串,正是视频的resourceInfoId,视频的下载地址就这样暴露了哈哈。来试试看:

http://abook.hep.com.cn/downLoadResouce.action?resourceInfoId=5000261344

我成功地得到了想要的视频。


怎样批量下载文件呢? 如果是我的话,因为我只需要下载这么一本书的配套文件,没必要花时间去分析 resourceInfoId 的规律/摊手。真香。我会一个个把链接复制下来(javascript开头的那个),然后批量替换成可下载的链接,必要的时候可以用一点正则表达式。因为得到的链接是必须要登录账号才能下载的,不能用迅雷等软件,我只好一个个点开链接把文件下载下来。 是不是觉得不够优雅?我也这样觉得,用爬虫做这件事是很自然、优雅的,如果我以后也有同样的下载文件的需求,一劳永逸。但写爬虫也得花时间啊,我的知识储备也暂时不允许我流畅地完成一个爬虫。


我全程都没有用到什么高深的知识,让那些点进来的,想看高深算法、解密骚操作的朋友们失望了/笑哭/笑哭。???