Forum >> Principianti >> Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?

Pagina: 1

All'interno di un oggetto zuppa ho preso tutto il testo della divisione `inner_left2` dove ci sono articoli e date e voglio ottenere tutti gli articoli e le date in un dataframe. Sembra che gli articoli e le date siano nel tag `span`. Allora ho fatto:







    page = requests.get('https://www.abcbourse.com/marches/news_valeur.aspx?p=1&s=DJIAx')
    # Create a BeautifulSoup object

    soup = BeautifulSoup(page.text, 'html.parser')

    actualites_ws = soup.find(class_='inner_left2')

    articles_list = actualites_ws.find_all('span')








Questo dà il seguente:




    [<span class="n12">DJIA - <a href="/marches/aaz.aspx?M=usau"><img alt="" class="tipt" height="12" src="/game/flag/US.gif" title="USA" width="18"/></a></span>,

     <span class="quote_upb"><img alt="" height="20" src="/5/quote_up_fl.png" width="30"/>0,57%</span>,

     <span class="lh24">

     <span class="mr5">16/01/19 22:30</span>

     <a href="wall-street-finit-en-hausse-goldman-sachs-et-bank-of-america-a-l-honneur_459575_DJIAx.aspx">Wall Street finit en hausse, Goldman Sachs et Bank of America à l'honneur</a> (AFP)<br/>

     </span>,

     <span class="mr5">16/01/19 22:30</span>,

     <span class="lh24">

     <span class="mr5">16/01/19 16:14</span>

     <a href="wall-street-soutenue-par-les-resultats-de-banques-ouvre-en-hausse_459537_DJIAx.aspx">Wall Street, soutenue par les résultats de banques, ouvre en hausse</a> (AFP)<br/>

     </span>,

    ...






Ma quando provo a trasformarlo in un dataframe, non funziona:







    >>>df = pd.read_html(articles_list)

    TypeError: Cannot read object of type 'ResultSet'






















--- Ultima modifica di MikeI in data 2019-01-17 11:29:46 ---


Pagina: 1



Esegui il login per scrivere una risposta.