فناوری به وقت تبریز: استفاده از پایتون برای استخراج داده از وب

شروع رویداد
جمعه ۵ آذر ۹۵ ۰۸:۰۰
پایان رویداد
جمعه ۵ آذر ۹۵ ۱۸:۳۰
مکان رویدادتبریز
موضوع رویدادتکنولوژی / برنامه نویسی
اضافه به تقویم
فناوری به وقت تبریز: استفاده از پایتون برای استخراج داده از وب
برگزارکننده‌ی رویداد
تماس با برگزارکننده
۰۴۱۳۶۳۸۹۱۰۴
گزارش
مهلت ثبت‌نام برای این رویداد به پایان رسیده است.

زمان‌بندی کارگاه «استفاده از پایتون برای استخراج داده از وب» (Web Scraping using Python)

جمعه ۵ آذر
عنوانشروعپایان
نصب و راه‌اندازی نرم‌افزارهای پیش نیاز (اگر مسأله‌ای داشتید)۸۸:۳۰
بخش اول کارگاه۸:۳۰۱۳:۱۵
استراحت، عبادت، ناهار [مهمان Tabriz.IO] و...۱۳:۱۵۱۴
بخش دوم کارگاه۱۴۱۸:۳۰

توضیحات بیشتر

 نکات کلی:

  • ظرفیت هر کارگاه ۱۲ نفر است.
  • به شرکت‌کنندگان کارگاه‌ها، گواهینامه رسمی بیان (دو زبانه، با هولوگرام شرکت بیان و امضای مدیر عامل) اهدا می‌شود؛ گواهی‌نامه‌ها، پس از پایان یک دوره از کارگاه‌ها صادر و برای افراد ارسال می‌شود و البته در آن، عنوان کارگاه‌هایی ذکر خواهد شد که آن شخص در آنها حضور یافته است.
  • برای شرکت کنندگان هر کارگاه، کد تخفیف ۳۰ درصدی کارگاه‌های بعدی آن دوره ارائه می‌شود.
  • پس از هر کارگاه، دسترسی به ویدئوی مباحث ارائه شده برای شرکت کنندگان فراهم خواهد شد.
  • می‌توانید برای اطلاعات بیشتر به تارنمای Tabriz.IO مراجعه نمایید.
  • لطفاً هر پرسش، پیشنهاد و یا انتقادی را با ما مطرح فرمایید.

پیش نیاز کارگاه

  • اگر مشکلی در نصب و راه‌اندازی نرم‌افزارهای پیش نیاز داشتید، نیم ساعت قبل از شروع کارگاه حضور پیدا کنید تا از مباحث عقب نیافتید.

محتوای دوره

استفاده از پایتون برای استخراج داده از وب

وجود داده، پیش نیاز پردازش و تحلیل داده در مهندسی داده است؛ گاهی داده به صورت دادگان آماده در دسترس پژوهشگران قرار می‌گیرد و گاهی هم نیاز است آن را از منابع مختلف همچون وب استخراج کنیم. در کارگاه استخراج داده از وب، بر آنیم که طریقه استفاده از اینترنت را به عنوان یک منبع عظیم و مفید داده بوسیله زبان برنامه نویسی پایتون یاد بگیریم.

در این میان خواهیم آموخت که چگونه صفحات وب را خوانده، تجزیه کرده و اطلاعات مورد نیاز خود را از آن استخراج کنیم. همچنین با معماری صفحات html، فایل‌های json و xml آشنا خواهیم شد و بوسیله فریم ورک Scrapy (دهمین کتابخانه پرطرفدار پایتون در GitHub) به خزش روی صفحات سایت‌های مختلف خواهیم پرداخت. در انتها نیز در قالب یک پروژه، استخراج تمامی داده‌های یک سایت خبری و یا یک سایت خرید کالا را مرور می‌کنیم.

Web Scraping using Python

[ Introduction to Data Scraping ]

[ Working With APIs ]

[ XML, JSON and the REST Architecture ]

[ Parsing Html ]

[ Regular Expression ]

[ XPath and CSS Selector ]

[ Web Scraping Using Scrapy ]

[ Writing a Crawler ]

 

 

اما در کارگاه پیشین برای کسانی که اشتیاق و علاقه به یادگیری تجربه‌ها و مهارت‌های کاربردی پایتون را در عمل دارند، به مباحث زیر پرداخته شده است (یادآوری این نکته لازم است که برای شرکت کنندگان هر کارگاه، کد تخفیف ۳۰ درصدی کارگاه‌های بعدی آن دوره ارائه می‌شود، پس برای کسانی که در کارگاه «پایتون» از اشتیاق تا اشتغال ثبت نام کنند، کد تخفیف ۳۰ درصدی کارگاه استفاده از پایتون برای استخراج داده از وب و همچنین کارگاه‌های بعدی این دوره ارائه می‌شود):

فناوری به وقت تبریز: «پایتون» از اشتیاق تا اشتغال

“Python” from Passion to Profession

[ Variables, expressions, and statements ]

[ Functions ]

[ Conditionals ]

[ Iteration ]

[ Strings ]

[ Tuples ]

[ Lists and List Algorithms ]

[ Dictionaries ]

[ Modules ]

[ Files ]

[ Classes and Objects ]

[ Exceptions ]

[ More Advanced Topics ]

معرفی مدرس

«محمد مهدی نعمت الهی» دانشجوی دکتری هوش مصنوعی و مدیر واحد پردازش زبان‌های طبیعی «شرکت بیان» هستند.

آدرس:تبریز آبرسان، طبقه جنب قنادی پاک، مجتمع فنی تهران، شعبه تبریز

اگر مایل به اطلاع از رویدادهای مشابه این رویداد هستید، کلیک کنید.