Como ler uma página web usando python

Isto irá mostrar-lhe como ler uma página web a partir de um script python dado um URL.

instruções

  1. Instale o construtor python a partir daqui. É de graça.

    https://python.org/download/releases/2.5.2/

  2. Depois de ter instalado Python você pode executá-lo a partir do menu Iniciar

    Python 2.5 - IDLE (GUI Python)

  3. Uma vez que o aplicativo é aberto, ele se parece com o bloco de notas. Escolha arquivo no menu na parte superior e uma nova janela. Isto irá abrir uma nova janela de texto que você pode salvar o seu código python para.

  4. Copie o código a seguir para a nova janela que acabou de abrir.

    shutil importação
    import os
    tempo de importação
    data e hora de importação
    matemática de importação
    urllib importação
    da matriz de importação matriz

    filehandle = urllib.urlopen ( `https://loothog.com`)

    Nas linhas das filehandle.readlines ():

    linhas de impressão

    filehandle.close ()

    As linhas recuadas será executado através do loop.
  5. Escolha Arquivo - Salvar e nomear o arquivo que quiser.



  6. Pressione F5 para executar o código.

    Para interromper a execução do programa, clique para a primeira janela que se abriu e selecione no menu Shell - Shell Restart

  7. Você pode salvar todas as linhas em um arquivo de texto, modificando o código para ficar assim.

    myFile = open ( `test.html`, `w`)
    Nas linhas das filehandle.readlines ():

    linhas de impressão
    myFile.write (linhas)

    myFile.close ()
    filehandle.close ()

  8. Talvez você tem algumas cotações de ações que esta aparência
    AAAC, D, 20071210,8.2,8.2,8.2,9.5,1000

    e você deseja obter o preço próximo de 9,5, então você pode dividir o line up pela vírgulas e acesso apenas a 9,5 como este

    myFile = open ( `test.html`, `w`)
    Nas linhas das filehandle.readlines ():

    section = lines.split ( `,`)
    str impressão (seções [6] .strip ())
    myFile.write (str (seções [6] .strip ()))

    myFile.close ()
    filehandle.close ()

    Nota: O str () converte o número para uma cadeia ea .strip () vai tirar espaços extras no final.

    Diversão com Python

dicas & avisos

  • As linhas após "Nas linhas das filehandle.readlines ():" são recuadas 5 espaços.
De esta maneira? Compartilhar em redes sociais:

LiveInternet