Mine værktøjer
Du er her: Forside diverse filer til download mm. urlreg.py
Handlinger tilknyttet webside

urlreg.py

af adminSidst opdateret 25/05 2007 12:26

Få information fra bestemte hjemmesider Jeg har en liste over en rækkehjemmesider der alle indeholder information der skal indhentes. Den fælles information er tekst lignende: "brugernavn: XXXXX" Hvor det der skal gemmes er brugernavnet. Listen over de sider der skal indhentes information fra er kendt på forhånd og teksten er fælles for alle sammen. Er der en nem og hurtig måde man kan hente informationen på? Uden at man manuelt skal søge hver side igennem?

Klik her for at hente fil

Størrelse: 1 kB - Filtype text/python-source

Indhold af fil-indholdsobjekt

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""Usage: urlreg.py <url>
    <url>   : is page to look up on the internet
    <regexp>: Regular expression to match
    
    Output all the matches on stdout

    svar på spørgsmål på http://www.eksperten.dk/spm/779634
    example:
    p&aring; kommandolinien skrives
    
    pyton.exe urlreg.py http://www.databassen.dk:8090/bfcl/Members/bauer/test 'brugernavn:\w+'
    brugernavn:bertel
    brugernavn:niels
"""
import urllib, re, sys

try: # Fetch the arguments
    url     = sys.argv[1]
    regexp  = sys.argv[2]
except:
    print __doc__

source = urllib.urlopen(url).read()
regexp = re.compile(r'%s' % ( regexp ) )
res = regexp.findall( source )
for match in res:
    print match
« august 2018 »
søn man tir ons tor fre lør
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Chat Rooms
Dyrk motion

Trim ballerup

 

Powered by Plone, the Open Source Content Management System