BeatifulSoup4 get_text仍然具有JavaScript

部分基于能否使用BeautifulSoup删除脚本标签？

import urllib
from bs4 import BeautifulSoup

url = "http://www.cnn.com"
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html)

# kill all script and style elements
for script in soup(["script", "style"]):
    script.decompose()    # rip it out

# get text
text = soup.get_text()

# break into lines and remove leading and trailing space on each
lines = (line.strip() for line in text.splitlines())
# break multi-headlines into a line each
chunks = (phrase.strip() for line in lines for phrase in line.split("  "))
# drop blank lines
text = '\n'.join(chunk for chunk in chunks if chunk)

print(text)

javascript 2022/1/1 18:45:51 有369人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

Hibernate用户和朋友JsonReference

Hibernate用户和朋友JsonReference

其他 2022-01-01 784
带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

Java 2022-01-01 836
我可以使用BeautifulSoup删除脚本标签吗？

我可以使用BeautifulSoup删除脚本标签吗？

其他 2022-01-01 759
使用Hibernate Criteria API编写HQL子句

使用Hibernate Criteria API编写HQL子句

其他 2022-01-01 758
获取“ java.lang.NoClassDefFoundError：com / beust / jcommander / ParameterException”异常

获取“ java.lang.NoClassDefFoundError：com / beust / jcommander / ParameterException”异常

java 2022-01-01 742
无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

其他 2022-01-01 805
Hibernate-AnnotationConfiguration已弃用

Hibernate-AnnotationConfiguration已弃用

其他 2022-01-01 757
在不重新启动JVM的情况下重新加载JAVA中的Kerberos配置

在不重新启动JVM的情况下重新加载JAVA中的Kerberos配置

java 2022-01-01 630
Hibernate和通用字段映射

Hibernate和通用字段映射

其他 2022-01-01 688
C3P0 Spring Hibernate：池已满。如何调试？

C3P0 Spring Hibernate：池已满。如何调试？

Java 2022-01-01 686
Spring / Hibernate / JUnit-没有Hibernate Session绑定到线程

Spring / Hibernate / JUnit-没有Hibernate Session绑定到线程

Java 2022-01-01 714
Java SE 6中的JPA / Hibernate，用于数据访问的最佳实践

Java SE 6中的JPA / Hibernate，用于数据访问的最佳实践

java 2022-01-01 697
Hibernate工具可以生成JPA POJO吗？

Hibernate工具可以生成JPA POJO吗？

其他 2022-01-01 825
访问关联实体的ID时Hibernate生成SQL查询

访问关联实体的ID时Hibernate生成SQL查询

SQLServer 2022-01-01 756
在Netbeans的Tomcat 7上运行Java EE 7

在Netbeans的Tomcat 7上运行Java EE 7

java 2022-01-01 697
Jenkins-如何访问BUILD_NUMBER环境变量

Jenkins-如何访问BUILD_NUMBER环境变量

其他 2022-01-01 622
onSave（）（用于使用Hibernate / Spring数据存储库保存的任何实体）

onSave（）（用于使用Hibernate / Spring数据存储库保存的任何实体）

Java 2022-01-01 753
Flutter：如何使用Firebase PhoneNumberAuth修复设备丢失的连接错误

Flutter：如何使用Firebase PhoneNumberAuth修复设备丢失的连接错误

其他 2022-01-01 700
为什么Hibernate切换为通过CLOB使用LONG？

为什么Hibernate切换为通过CLOB使用LONG？

其他 2022-01-01 736
更改Spring 5处理空Bean的方式？

更改Spring 5处理空Bean的方式？

Java 2022-01-01 557

BeatifulSoup4 get_text仍然具有JavaScript

撰写回答

推荐问题

Hibernate用户和朋友JsonReference

带有Hibernate 5和Spring 4的程序化SchemaExport / SchemaUpdate

我可以使用BeautifulSoup删除脚本标签吗？

使用Hibernate Criteria API编写HQL子句

获取“ java.lang.NoClassDefFoundError：com / beust / jcommander / ParameterException”异常

无法检查Expect（elm）.not.toBeVisible（）的语义UI反应组件

Hibernate-AnnotationConfiguration已弃用

在不重新启动JVM的情况下重新加载JAVA中的Kerberos配置

Hibernate和通用字段映射

C3P0 Spring Hibernate：池已满。如何调试？

Spring / Hibernate / JUnit-没有Hibernate Session绑定到线程

Java SE 6中的JPA / Hibernate，用于数据访问的最佳实践

Hibernate工具可以生成JPA POJO吗？

访问关联实体的ID时Hibernate生成SQL查询

在Netbeans的Tomcat 7上运行Java EE 7

Jenkins-如何访问BUILD_NUMBER环境变量

onSave（）（用于使用Hibernate / Spring数据存储库保存的任何实体）

Flutter：如何使用Firebase PhoneNumberAuth修复设备丢失的连接错误

为什么Hibernate切换为通过CLOB使用LONG？

更改Spring 5处理空Bean的方式？

分类汇总

您的鼓励是对我最大的支持