נושא: רעיונות לפרוייקט גמר
|
|
כותב |
|
-2t- משתמש מתחיל
הצטרף / הצטרפה: 23 June 2012
משתמש: מנותק/ת הודעות: 4
|
נשלח בתאריך: 23 June 2012 בשעה 17:06 | | IP רשוּם
|
|
|
|
אהלן,
תציעו רעיונות לפרוייקט גמר.
כל מה שעולה לכם בראש מאוד יעזור לי.
נתקעתי על רעיון... אבל המרצים לא אהבו את הרעיון...
לא יוצא לי מהראש :-)
אשמח לשמוע רעיונות.
__________________ בברכה, מתן.
|
חזרה לתחילת העמוד |
|
|
shoshan מנהל האתר
הצטרף / הצטרפה: 16 July 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 4637
|
נשלח בתאריך: 23 June 2012 בשעה 19:38 | | IP רשוּם
|
|
|
|
םרוייקט גמר ב-.......?
__________________ עד מתי רשעים יעלוזו?
עַל כֵּן אֶמְאַס וְנִחַמְתִּי עַל עָפָר וָאֵפֶר.
|
חזרה לתחילת העמוד |
|
|
-2t- משתמש מתחיל
הצטרף / הצטרפה: 23 June 2012
משתמש: מנותק/ת הודעות: 4
|
נשלח בתאריך: 23 June 2012 בשעה 20:09 | | IP רשוּם
|
|
|
|
במדעי המחשב, כמובן.
תוכנה לעשות...
משחק מחשב...
אפליקציה לאיפד/איפון/...
__________________ בברכה, מתן.
|
חזרה לתחילת העמוד |
|
|
shoshan מנהל האתר
הצטרף / הצטרפה: 16 July 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 4637
|
נשלח בתאריך: 23 June 2012 בשעה 22:10 | | IP רשוּם
|
|
|
|
אני לא יודע מה הסדר גודל של הפרוייקט שאתה רוצה לבנות
(כמות שעות)
שם לך פה המלצה למשהו סביבות 60-70 שעות של מפתח מנוסה.
משהו שאני עובד עליו כרגע:
Web Crawler
הבסיס:
הכנסת כתובת אתר וסריקה שלו
מעקב אחרי קישורי
שליטה בקצב הסריקה (threads, כמות בקשות לשנייה/דקה)
זיהוי של סוג תוכן (html, pdf, jpg, gif, png, zip, doc,
docx, etc...)
מעקב אחרי קישורי a href
מעקב אחרי קישורי area href
זיהוי קנוניקל (גם כסוג של קישור)
זיהוי meta description
זיהוי title
זיהוי העומק של כל עמוד (מספר קישורים מינימאלי מהעמוד
הראשי עד שמגיעים אליו) - זה משפיע גם על הסדר בו סורקים
עמודים - לא אקראי אלא לפי העומק של הראשון שמצאנו אליהם
חילוץ הטקסט של כל עמוד
תמיכה ב-nofollow (גם כ-meta tag)
תמיכה בזיהוי הקידוד של עמודים גם לפי meta וגם לפי http
header
זיהוי הטקסט / סוג של כל קישור (כולל ה-alt של תמונות
בקישור).
בחילוץ טקסט התעלמות מתגיות label, button, וכו' - חלקים
בעמוד שם לא באמת הטקסט הסמנטי שבעמוד
דו"חות:
עבור הבאים מציאת עמודים ללא תוכן או עם תוכן משוכפל:
טקסט, תיאור, כותרת
(יש להתעלם מעמודים שהקנוניקל שלהם הוא לא הכתובת המקורית
שלהם)
עמודים שמחזירים קוד
בכל רשימת עמודים ניתן לראות עבור כל עמוד מספר ורשימת
עמודים שמקשרים אליו (זה רקורסיבי מן הסתם)
עמודים שמחזירים קוד HTTP מספר 5XX
עמודים שמחזירים קוד HTTP מספר 4XX
עמודים שחסומים מאינסוקס ומה חוסם אותם
קישורים חיצוניים (שלא נסרקים כיוון שהם מחוץ לאתר)
קישורים שעברו recirect (הכתובת הסופית שונה מהכתובת שלחצו
עליה)
אפשרויות נוספות:
שליטה ב-User Agent של הסורק
אפשרות לערוך robots.txt פר סריקה
הגבלת מספר עמודים מאונדקסים בסריקה.
חיפוש באתר לפי: URL, full text.
שמירת סריקה של אתר להמשך מאוחר יותר.
סריקה מחדש של כל העמודים בסריקה ישנה - ומציאת כתובות
שבורות.
בונוסים:
אפשרות לתמיכה / חסימת עוגיות
זיהוי עמודים שדורשים עוגיות (ע"י שרשרת הפניות לעצמם)
אפשרות להכנסת כמה אתרים לסורק (גם קישורים בין האתרים
יסרקו וגם כל האתרים יסרקו)
__________________ עד מתי רשעים יעלוזו?
עַל כֵּן אֶמְאַס וְנִחַמְתִּי עַל עָפָר וָאֵפֶר.
|
חזרה לתחילת העמוד |
|
|
-2t- משתמש מתחיל
הצטרף / הצטרפה: 23 June 2012
משתמש: מנותק/ת הודעות: 4
|
נשלח בתאריך: 24 June 2012 בשעה 12:06 | | IP רשוּם
|
|
|
|
וואו כל הכבוד! בהצלחה.
__________________ בברכה, מתן.
|
חזרה לתחילת העמוד |
|
|
-2t- משתמש מתחיל
הצטרף / הצטרפה: 23 June 2012
משתמש: מנותק/ת הודעות: 4
|
נשלח בתאריך: 24 June 2012 בשעה 15:15 | | IP רשוּם
|
|
|
|
סדר גודל של 60-70 שעות אני משער שזה בסדר.
__________________ בברכה, מתן.
|
חזרה לתחילת העמוד |
|
|
|
|
אם ברצונך להגיב לנושא זה עליך קודם להתחבר
אם אינך רשום/ה כבר עליך להרשם
|
אינך יכול/ה לשלוח נושאים חדשים בפורום זה אינך יכול/ה להגיב לנושאים בפורום זה אינך יכול/ה למחוק את הודעותיך ותגוביך בפורום זה אינך יכול/ה לערוך את הודעותיך ותגובותיך בפורום זה אינך יכול/ה לצור סקרים בפורום זה אינך יכול/ה להצביע בסקרים בפורום זה
|