分类: 爬虫

3 篇文章

thumbnail
爬取药监网站公司名录
##我的网盘/博客素材/爬取药监 #爬取药监总局化妆品生产许可企业名称 from selenium import webdriver from time import sleep from lxml import etree url = 'http://scxk.nmpa.gov.cn:81/xk/' bro = webdriver.Chrome(…
批量爬取NCBI
#我的网盘/博客素材/批量爬取NCBI # 安装R包 #install.packages('RSelenium') cd C:\Users\53446\Desktop\try2 java -Dwebdriver.chrome.driver="geckodriver.exe" -jar selenium-server-standalone-4.0.0…
爬取b站视频
##我的网盘/博客素材/爬取b站视频 import requests import re import json import subprocess def get_response(html_url): headers = { 'Referer': 'https://www.bilibili.com/video/BV1A44y1t7xt', 'U…