내 맘대로 위클리 뉴스 - 2016년 41주(10월 14일)
Data?, Data!, Data...
-
- 'Open Data'를 공개하는 분들에게 좋은 가이드라인이 될만한 기사
- 특히 'Open Data'에 대한 가이드 라인 중에서 'Can a non-programmer access the data?' 부분은 많은 시사점을 던져줌
- it occurred to me over and over again that we’re not all talking about the same thing when we say ‘open data’. Indeed there seemed to be a kind of fractal misunderstanding about what the word ‘open’ means, or more specifically who the ‘open’ is for.
- I think it should be a minimum goal for every data project that wants to legitimately use the term open to score at least a 3 on this test
- Finally, to make a data project truly open to anyone, we need to think about outreach, past the computer. There is a technocentricity to our platforms that is difficult to overcome: how do we make our data open to those with low levels (or no levels) of digital literacy?
-
Data Mining Hacker News: Front vs Back
- 해커뉴스의 첫 페이지를 분석하는 기사, 해당 뉴스 페이지를 분석함에 있어서 'Front'와 'Back'이라는 두 가지 개념을 가지고 SVM 기법으로 데이터를 분석
- 전체 소스코드를 제공하기 때문에 해당 기사에서 분석 방법으로 사용한 SVM을 연습하기에 좋음!
-
The Data of the Chicago Marathon
- 2005~2016년까지 진행된 시카고 마라톤에서 발생된 데이터를 분석한 기사
- 아주 단순화된 그래프를 가지고 데이터 분석 결과를 설명하고 있는 것 같지만, 그래프의 종류가 매우 다양하기 때문에 데이터분석과 시각화에 관심이 있는 분들에게 추천!
Python with PY Family
-
An Intro to the Python Imaging Library / Pillow
Pillow
를 처음 접하는 분들에게 유용한 튜토리얼 기사- 다른 튜토리얼로 How to Create a Diff of an Image in Python도 추천함
-
Write your first web scraper in Python with Beautifulsoup
requests
와BeautifulSoup
를 사용해서 Web Scraper를 작성하는 튜토리얼 기사- 코드가 짧고 직관적이기 때문에 BS4를 처음 접하시는 분들에게 많은 도움이 될 것 같음
-
Dealing with database transactions in Django + Celery
- Celery를 사용해서 트랜잭션을 관리하는 방법을 소개하는 튜토리얼 기사
- Flaks에 비해서 Django는 Celery를 붙여서 사용하기 매우 편리하게 구성되어 있는 것 같아서 부러움