본문 바로가기

모아두기

이글루스 서비스 종료로 인한 포토로그 사진 다운로드 크롤링 파이썬 소스 코드

 

 

이글루스 서비스가 종료되어 버리는 바람에 20년 동안 쌓아둔 일기장을 조금씩 옮기고 있습니다.

 

아, 이 때 이랬었지 라는 추억을 모두 옮길 수는 없어서

주요한 글들만 티스토리 혹은 네이버 블로그로 시간 날 때마다 한땀 한땀 하나씩 옮기고 있는데

 

아뿔싸!!

포토로그 생각을 못했네

아.. 이건 사람이 수작업으로 다운로드 받을 수 있는 분량이 아니야

부랴 부랴 사진 다운로드 받는 파이썬 코드를 작성했습니다

 

 

아니, 근데

이글루스는 데이터 백업을 어떻게 해주겠다 알려줘야

 

들어보니

음.. 맘에 들어! 내가 별거 안해도 되겠어. 기다렸다 데이터 백업 진행하면 되겠군.

하던가

 

맘에 안드네, 서비스 종료전에 뭔가 해야겠군

이렇게 맘을 먹던가 할텐데

 

뭘 어쩌겠다는건지 말도 없고, 

각자도생 하라는 건지 알 수도 없고

 

 

결국 저는 알아서 옮기고 있습니다.

 

글을 다운로드 받는 크롤링 코드도 짜볼까 했는데

그걸 받아서 다시 올릴 곳도 마땅찮고, 

(올리는 프로그램을 또 짜야 하나??)

 

프로그램을 만든다 한들, 과거 날짜로 올라가는게 아니라서

그냥 대부분의 글들은 포기하고 다 버리기로 했습니다.

 

 

파이썬 소스코드

python 으로 후다닥 작성을 했습니다.

 

이글루스 포토로그 RSS 피드를 읽어서

사진만 골라내고

앨범명으로 폴더를 만들어 사진들을 다운로드 받는 코드 입니다.

 

7번 라인의 RSS 피드 주소를 본인 이글루스 포토로그 RSS 피드 주소로 수정해 주면 됩니다.

 

본인의 RSS 주소를 입력하면

다운로드 받아주는 UI를 갖는 프로그램으로 까지 완성도를 높여보면 좋겠지만

 

내 코가 석자라 내가 편한 정도까지만 만들었습니다

UI를 갖는 멋진 프로그램은 다른 분이 해주시리라 생각해 봅니다

(개인 적으로 UI 프로그래밍을 싫어 해서 그렇기도 합니다

전 프론트엔드 개발이 싫어요.)

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
import os
import feedparser
from bs4 import BeautifulSoup
from urllib.request import urlopen
from datetime import datetime, timedelta, timezone
 
url = "http://madchick.egloos.com/photo/photo.xml"
feed = feedparser.parse(url)
 
for entry in feed['entries']:
    pubDate = entry['published']
    pubDate = datetime.strptime(pubDate,"%a, %d %b %Y %H:%M:%S GMT")
    pubDate = pubDate.astimezone(timezone(timedelta(hours=9))).strftime('%Y-%m-%d')
    
    folderName = entry['title']
    folderName = folderName.replace("/","")    
    folderName = folderName.replace(":","")
    folderName = folderName.replace("*","")
    folderName = folderName.replace("?","")
    folderName = folderName.replace("<","")
    folderName = folderName.replace(">","")
    folderName = folderName.replace("|","")
    folderName = folderName.replace("\"","")
    folderName = folderName.replace("\\","")
    folderName = folderName.replace("..","")
 
    folderName = pubDate + " " + folderName
    os.makedirs(folderName,exist_ok=True)
    print(folderName)
    
    soup = BeautifulSoup(entry['description'], 'html.parser')
    soup.find_all('a')
    n = 1
    for link in soup.find_all('a'):
        imageName = link.get('href')
        path,ext = os.path.splitext(imageName)
        if ext == '.jpg' or ext == '.png' or ext == '.gif':
            print(imageName)
            with urlopen(imageName) as f:
                with open('./' + folderName + '/' + str(f"{n:05d}"+ '.jpg','wb'as h:
                    img = f.read()
                    h.write(img)
            n += 1
cs

 

 

사용상 주의사항

이글루스 포토로그 RSS 피드가 5개 밖에 제공을 안해 줍니다.

 

가장 최근 것 5개 다운로드 받고

이글루스 관리자 화면 들어가서 포토로그의 앨범/사진 관리 메뉴에서

가장 최근 앨범 5개 삭제 하고

 

다시 앨범 5개 다운로드 받고

이짓 거리를 계속 해서 반복 해야 합니다.

개노가다!!

 

특히, 앨범을 삭제하면서 진행해야 하기 때문에

실수로 다운로드 받지 않은 앨범 지우면 낭패 입니다

 

위에서부터 하나씩 지우면서 5개만 잘 지워야 합니다.

젠장

 

써 놓고도 뭐 하자는 건지 저도 잘 모르겠네요

 

암튼, 이걸로 저는 이글루스 포토로그 200여개 앨범, 1,987장 사진을 안전하게 다운로드 받아 백업에 성공했습니다.

이글루스 서비스 종료에 따른 추억 백업 각자도생

모두들 건투를 빕니다

 

 

이글루스 블로그, 드디어 20년만에 서비스 종료

개인 홈페이지 운영하다, 블로그 라는 것을 알게되고 참 오랜기간 사용했던 서비스가 20년만에 서비스가 종료되네요. 영원한 서비스는 없겠지만, 참 아쉽기도 하고. 그래도 참 오래 서비스 되었

madchick.tistory.com

 

 

 

007 No Time To Die - 노 타임 투 다이, 롤러코스터 관람 후기

다니엘 크레이그 007 마지막 작품 이라고 해서 챙겨봤습니다. 사실 007 영화는 극장 가서 잘 안봤습니다. 그냥 집에서 모니터로 봐도 충분하다고 생각해서요. 용산 아이맥스에서 봤는데, 우아 아

madchick.tistory.com

 

디즈니 플러스, 호크아이 - 마블 새 영웅 비숍 이야기

디즈니 플러스 오리지널 시리즈 마블 드라마 호크아이 11월 24일 수요일, 마블의 새로운 시리즈가 공개되었습니다. 디즈니 플러스 독점입니다. 재밌습니다. 꼭 보세요. 디즈니 플러스에서만 공개

madchick.tistory.com

 

코민스키 메소드 - 넷플릭스 오리지널, 코믹하고 감동적인 의외로 재미난 노년 이야기

주말 정주행 추천작 지금까지 가장 좋았던 드라마는 "나의 아저씨" 입니다. - http://madchick.egloos.com/4201676 저는 나의 아저씨를 이제야 봤지만 다들 보셨을 것 같으니 제외하고, 괜찮은데 많이들 모

madchick.tistory.com

 

디즈니 플러스 팔콘과 윈터솔져, 엔드게임 이후 이야기

디즈니 플러스 가입하신 분들은 꼭 보세요. 마블 시리즈 좋아하는 분들은 디즈니 플러스 꼭 가입하시고요. ​ 디즈니 플러스가 드디어 국내 서비스를 시작했습니다. 다른 OTT 서비스들 보다는 좀

madchick.tistory.com

 

넷플릭스 애나 만들기, 힙한 바이브 넘치는 내돈 없이 사업하기

일단 보기 시작하면 9편 다 보게 됩니다. 매우 흥미롭고 재밌습니다. 상 또라이 같기도 하고, 머리는 엄청 좋은 것 같기도 하고. 다른 사람 이용만 해먹는 못된 양아치 소시오패스 같은데, 미워할

madchick.tistory.com

728x90