盘点一下最近用selenium时出现的坑之四
写在开始这个坑我应该是记得比较清楚,那就是我最开始写的时候出现了一个非常坑的事,'Element is no longer attached to the DOM',这个问题.描述selenium里面所有的定位到的WebElement我认为都只是一个指针指向这个页面的某一个地方,然后如果你这时候get了一个新的url那么之前的那些就全部作废了.解决方法在get新的链接的之前把该爬的爬完就行了...
写在开始这个坑我应该是记得比较清楚,那就是我最开始写的时候出现了一个非常坑的事,'Element is no longer attached to the DOM',这个问题.描述selenium里面所有的定位到的WebElement我认为都只是一个指针指向这个页面的某一个地方,然后如果你这时候get了一个新的url那么之前的那些就全部作废了.解决方法在get新的链接的之前把该爬的爬完就行了...
写在开始这是我另一个出现的坑,倒是让我纠结了好久.复合类名的定位在HTML里面有一些元素的类名会像是这样的"a b",不过用selenium定位的话会出现一点小问题,那就是Compound class names not permitted,这个问题我绕了好久都没绕出去,这个问题就是selenium里面不支持带空格的类名,但是这个类名又带着空格,不这样子查有的时候又查不到...
写在开始最近有在用selenium做一些更复杂的工作,然后顺便出现了好多问题,下面盘点一下,当然是我还记得的.瀑布流问题有些网页属于动态加载网页的,根据你现在的页面位置来动态加载需要的内容,当然这样子用户体验会更好一点,毕竟会缩短第一次的加载时间嘛,然而对于爬虫来说似乎很悲催,因为如果只能获取静态网页的爬虫就解决不了这个问题了,除非模拟这个网站的get和post请求,所以显得很麻烦,当然了,...