כותב |
|
אורי אורח
הצטרף / הצטרפה: 01 October 2003
משתמש: אונליין הודעות: 12647
|
נשלח בתאריך: 17 November 2007 בשעה 16:13 | | IP רשוּם
|
|
|
|
שלום,
יש ברשותי רשימה של כתובות URL, שחלקן הן בעצם הפניות לכתובת אחרת.
למשל, הכתובת http://snipurl.com/1ts7y מפנה למעשה לעמוד פורום בתפוז, כלומר לכתובת http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89.
אני נדרש "לתרגם" את רשימת הכתובות הנתונות לרשימת כתובות סופיות, כלומר, עבור כל כתובת מקורית - אני מבקש לחלץ את היעד הסופי אליו היא מפנה. כמובן שכדי לדעת לאן הכתובת מפנה נדרש לגלוש אליה בפועל (אי אפשר לחלץ זאת ע"י התבוננות ב-URL עצמו).
לצערי יש לי ניסיון תכנותי רק בג'אווה, לכן אשמח אם ההצעות יתייחסו לשפה זו, או ליישומי צד שלישי שיכולים לפתור בעיה זו.
תודה רבה, אורי
|
חזרה לתחילת העמוד |
|
|
11010010110 פורומיסט על
הצטרף / הצטרפה: 23 April 2006
משתמש: מנותק/ת הודעות: 2621
|
נשלח בתאריך: 17 November 2007 בשעה 16:57 | | IP רשוּם
|
|
|
|
קצת משחק בקונסול : (לינוקס)
בדוגמא עשיתי את זה ידני. אני מאמין שתסתדר אם אוטומציה של התהליך וכן ניקוי קובץ הפלט
אפשרות 1
קוד:
i11010010110 ~/Desktop echo 1 |cat >file i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop wget --spider -a file http://snipurl.com/1ts7y i11010010110 ~/Desktop cat file 1 --17:52:12-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:12-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:15-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:16-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:17-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:17-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:19-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:23-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:24-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:25-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:25-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:29-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:30-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:30-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:31-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:32-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:37-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:37-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:39-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:39-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:40-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:41-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:41-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:42-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:42-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:43-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
--17:52:43-- http://snipurl.com/1ts7y => `1ts7y' Resolving snipurl.com... 75.126.161.224 Connecting to snipurl.com|75.126.161.224|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [following] --17:52:44-- http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 => `forumpage.asp?id=89.3' Resolving www.tapuz.co.il... 212.150.54.150 Connecting to www.tapuz.co.il|212.150.54.150|:80... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/html] 200 OK
i11010010110 ~/Desktop |
|
|
אם רוצים קובץ פלט נקי יותר אז . . . . אפשרות 2
קוד:
i11010010110 ~/Desktop echo 1 |cat >file
i11010010110 ~/Desktop mkdir temp
i11010010110 ~/Desktop cd temp/
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp rm -f *
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp wget -nv -a ../file http://snipurl.com/1ts7y
i11010010110 ~/Desktop/temp rm -f *
i11010010110 ~/Desktop/temp cd ..
i11010010110 ~/Desktop cat file
1
17:45:21 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [152322] -> "forumpage.asp?id=89" [1]
17:45:27 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157556] -> "forumpage.asp?id=89.1" [1]
17:45:29 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157580] -> "forumpage.asp?id=89.2" [1]
17:45:32 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157579] -> "forumpage.asp?id=89.3" [1]
17:45:45 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157580] -> "forumpage.asp?id=89" [1]
17:45:47 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157605] -> "forumpage.asp?id=89.1" [1]
17:45:50 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157556] -> "forumpage.asp?id=89.2" [1]
17:45:52 URL:http://www.tapuz.co.il/tapuzforum/main/forumpage.asp?id=89 [157584] -> "forumpage.asp?id=89.3" [1]
i11010010110 ~/Desktop |
|
|
הבעיה כאן היא שהמחשב ממש שומר לדיסק את העמודים ולכן יש צורך מדיי פעם למחוק את מה שיש בתיקיית ה temp
|
חזרה לתחילת העמוד |
|
|
אורי אורח
הצטרף / הצטרפה: 01 October 2003
משתמש: אונליין הודעות: 12647
|
נשלח בתאריך: 17 November 2007 בשעה 17:29 | | IP רשוּם
|
|
|
|
תודה על התגובה, אבל האמת היא שאני לא ממש בקטע של לינוקס (עדיין?)
יש חלופה ל-WIN?
|
חזרה לתחילת העמוד |
|
|
11010010110 פורומיסט על
הצטרף / הצטרפה: 23 April 2006
משתמש: מנותק/ת הודעות: 2621
|
נשלח בתאריך: 17 November 2007 בשעה 17:59 | | IP רשוּם
|
|
|
|
אני חושב שיש wget לחלונות
|
חזרה לתחילת העמוד |
|
|
אורי אורח
הצטרף / הצטרפה: 01 October 2003
משתמש: אונליין הודעות: 12647
|
נשלח בתאריך: 17 November 2007 בשעה 18:18 | | IP רשוּם
|
|
|
|
אכן מצאתי wget לחלונות.
נניח שאני רוצה לקחת קובץ טקסט בשם original.txt בו מופיעות הכתובות המקוריות, כל כתובת בשורה חדשה, ולקבל כפלט קובץ final.txt בו מופיעה בכל שורה ה"כתובת הסופית" של הכתובת המקורית המתאימה לה.
איזו פקודה עליי להקליד ב-windows?
תודה רבה על העזרה!
|
חזרה לתחילת העמוד |
|
|
אורי אורח
הצטרף / הצטרפה: 01 October 2003
משתמש: אונליין הודעות: 12647
|
נשלח בתאריך: 17 November 2007 בשעה 19:26 | | IP רשוּם
|
|
|
|
לא משנה. הצצתי בעזרה והסתדרתי.
תודה רבה!
|
חזרה לתחילת העמוד |
|
|
|
|