הצגת סילבוסים

קורס מספר: 89-542-01           
שם הקורס: ניהול נתוני עתק ברשת
סוג הקורס: הרצאה
שנה / סמסטר : תשע"ז    סמסטר ב
היקף שעות: 2 ש"ס     ניקוד:   1
שם המרצה: ד"ר יעל אמסטרדמר            פרטי התקשרות עם המרצה
תאריך עדכון אחרון:    05/12/2016

מטרות הקורס / תוצרי הלמידה*:

בקורס זה נסקור נושאים עכשוויים ומתקדמים בניהול של מידע המועבר באינטרנט. ניהול מידע אינטרנטי כרוך, בין היתר, באחסון וביצוע יעיל של פעולות על כמויות גדולות של מידע (כפי שנעשה, למשל, במנועי חיפוש), בהתמודדות עם קישוריות של מידע לפי תוכן או בעזרת לינקים, ובחילוץ ידע מתוך נתונים ובעזרת משתמשי הרשת. מטרת הקורס היא לערוך היכרות עם כלים ועקרונות מרכזיים בתחומים הנ"ל.


תאור הקורס:

תוכן הקורס: הקורס יסקור חמישה נושאים מרכזיים.

(1) ייצוג של נתונים אינטרנטיים

·        HTML, XML, keyword-based indexing

(2) חיפוש ודירוג של דפי אינטרנט

·        keyword-based search, authority, pagerank

(3) חישובים על נתוני עתק (big data)

·        MapReduce, Spark, query languages, query evaluation

(4) חילוץ נתונים ובניית מאגרי מידע

·        information extraction, ontologies, RDF, SPARQL

(5) איסוף וניהול נתונים בעזרת ההמונים (crowdsourcing)


דרישות קדם:

מערכות מסדי נתונים (89-581) או במקביל.


חובות / דרישות / מטלות**:

מבחן מסכם, תרגילים במהלך הסמסטר.


מרכיבי הציון הסופי:

85% בחינה

15% תרגיל


ביבליוגרפיה:

 

Abiteboul, Serge, et al. Web data management. Cambridge University Press, 2011.

 

 

Additional reading:

 

Dean, Jeffrey, and Sanjay Ghemawat. "MapReduce: simplified data processing on large clusters." Communications of the ACM 51.1 (2008): 107-113.

 

Doan, Anhai, Raghu Ramakrishnan, and Alon Y. Halevy. "Crowdsourcing systems on the world-wide web." Communications of the ACM 54.4 (2011): 86-96.

 

Data Algorithms: Recipes for Scaling Up with Hadoop and Spark by Mahmoud Parsian

 

RDF Database Systems: Triples Storage and SPARQL Query Processing by Olivier Curé, Guillaume Blin

 

 


שם הקורס באנגלית:
Management of Big Web Data

* תוצרי הלמידה (learning outcomes) הן הצהרות המציינות במפורש מה הלומדים צפויים להשיג בסוף תקופת הלימוד בקורס. תוצרי הלמידה מוגדרים במונחים של הישגי ידע, הבנה, כישורים, יכולות ו/או עמדות שהלומד מצופה להדגים כתוצאה מהתנסותו הלימודית האקדמית בקורס. לפרטים נוספים לחץ כאן .


** המדריך: איך תימנע מעבירות אתיות בהגשת עבודות. לקריאה לחץ כאן .