import AdvancedHTMLParser

parser = AdvancedHTMLParser.AdvancedHTMLParser();

parser.parseFile("bundestag.html")
links = parser.getElementsByClassName("linkGeneric")
for link in links:
    href = link.getAttribute("href")
    if href.endswith(".xls"):
        print href