em Fortaleza e suas respectivas sessões. Ótimo para quem gosta da
linha de comando. Vou fazer render mais, penso em fazer uma versão
para celulares em J2ME.
#!/usr/bin/python
# coding=iso-8859-15
# Bibliotecas necessarias
import string
import httplib
import sys
import re
from BeautifulSoup import BeautifulSoup
# Abrir pagina principal dos filmes para recuperar a lista de URL's
com os detalhes
httpconn = httplib.HTTPConnection('verdesmares.globo.com',80)
httpconn.request("GET","/v3/canais/default.asp?modulo=469")
r1 = httpconn.getresponse()
data1 = r1.read()
soup = BeautifulSoup(''.join(data1))
urls = soup.findAll('option',
value=re.compile('cinema_destaque.asp\?id_filme.*'))
#print temp[20]['value']
# Para cada filme recuperado, vamos pegar os horários
for i in range(len(urls)):
path = path = "/v3/canais/" + urls[i]['value']
httpconn.request("GET",path)
r2 = httpconn.getresponse()
data2 = r2.read()
soup = BeautifulSoup(''.join(data2))
nome = soup.findAll('span')
nome = list(nome[9].contents[0])
nome = nome[:len(nome)-7]
nome = nome[1:]
print ''.join(nome)
sessoes = soup.findAll('span', style="width:460px;")
for j in range(len(sessoes)/3):
print sessoes[3*j].a.string
print sessoes[3*j+1].em.string
print sessoes[3*j+1].contents[1]
print sessoes[3*j+2].em.string
print sessoes[3*j+2].contents[1]
print '\n'
Lembre dos espaços em branco após cada laço. Não sei como preservar a formatação por aqui, um dia aprendo ou mudo.
Post a Comment
Nenhum comentário:
Postar um comentário