Log

いろいろ

2020-01-13から1日間の記事一覧

BeautifulSoup4で値を取得したい要素に<br/>が含まれているとき

こんなのとかです。 <p> hoge <br/> piyo </p> このpに対してget_text()をすると返却値はhogepiyoになります。 from bs4 import BeautifulSoup html = '<p>hoge<br/>piyo</p>' soup = BeautifulSoup(html, 'html.parser') print(soup.get_text()) # -> hogepiyo <br/>などタグによる区切り</br/>…