terça-feira, setembro 02, 2008

Filmes em Fortaleza

Exercício de Python, pequeno script que recupera os filmes em cartaz
em Fortaleza e suas respectivas sessões. Ótimo para quem gosta da
linha de comando. Vou fazer render mais, penso em fazer uma versão
para celulares em J2ME.


#!/usr/bin/python
# coding=iso-8859-15

# Bibliotecas necessarias
import string
import httplib
import sys
import re
from BeautifulSoup import BeautifulSoup

# Abrir pagina principal dos filmes para recuperar a lista de URL's
com os detalhes
httpconn = httplib.HTTPConnection('verdesmares.globo.com',80)
httpconn.request("GET","/v3/canais/default.asp?modulo=469")
r1 = httpconn.getresponse()
data1 = r1.read()

soup = BeautifulSoup(''.join(data1))
urls = soup.findAll('option',
value=re.compile('cinema_destaque.asp\?id_filme.*'))
#print temp[20]['value']

# Para cada filme recuperado, vamos pegar os horários
for i in range(len(urls)):
path = path = "/v3/canais/" + urls[i]['value']
httpconn.request("GET",path)
r2 = httpconn.getresponse()
data2 = r2.read()
soup = BeautifulSoup(''.join(data2))

nome = soup.findAll('span')
nome = list(nome[9].contents[0])
nome = nome[:len(nome)-7]
nome = nome[1:]
print ''.join(nome)

sessoes = soup.findAll('span', style="width:460px;")

for j in range(len(sessoes)/3):
print sessoes[3*j].a.string
print sessoes[3*j+1].em.string
print sessoes[3*j+1].contents[1]
print sessoes[3*j+2].em.string
print sessoes[3*j+2].contents[1]

print '\n'



Lembre dos espaços em branco após cada laço. Não sei como preservar a formatação por aqui, um dia aprendo ou mudo.



Post a Comment

Nenhum comentário: