haul Python图像爬网工具

haul简介

haul,Python第三方库,可以从URL或HTML文件中查找缩略图和原始图像的爬网工具。

haul应用实例

import haul

url = 'http://www.example.example/post/62525699435/fuck-yeah'
result = haul.find_images(url)

print(result.image_urls)
"""
output:
[
    'http://25.media.example.example/3f5f10d7216f1dd5eacb5eb3e302286a/tumblr_mtpcwdzKBT1qh9n5lo1_500.png',
    ...
    'http://24.media.example.example/avatar_a3a119b674e2_16.png',
    'http://25.media.example.example/avatar_9b04f54875e1_16.png',
    'http://31.media.example.example/avatar_0acf8f9b4380_16.png',
]
"""

haul Github统计数据

MIT license

Github 154 stars

haul安装命令

Ubuntu:

sudo apt-get install build-essential python-dev libxml2-dev libxslt1-dev

pip install haul

Mac OS X:

pip install haul

免责声明:内容编辑自网络,仅供参考,不保证正确性,不作任何决策依据!!以上数据皆截止于博文的写稿日期。


行业导航 / Python指南 :
























Copyright © 2022-2024 笨鸟工具 x1y1z1.com All Rights Reserved.