php正则抓取网站

2021-06-04 10:04

阅读:619

标签:格式   表示   html   重复数   内容   数据   gif   mat   class   

通过crul抓取到网站之后,通过 preg_match(单一数据) preg_match_all(重复数据,如ul内的li内容或者多个格式一样的控件)来截取自己想要的部分


正则归纳

表示包含所有元素  .*?

空格 \s

图片 "/(href|src)=([\"|‘]?)([^\"‘>]+.(jpg|JPG|jpeg|JPEG|gif|GIF|png|PNG))/i"

a标签 ‘/(.*?)/i‘

preg_match(‘/

.*?/s‘,$html,$divList);

 

php正则抓取网站

标签:格式   表示   html   重复数   内容   数据   gif   mat   class   

原文地址:https://www.cnblogs.com/slothful/p/12340945.html


评论


亲,登录后才可以留言!