dlaud5379   10일 전

https://docs.google.com/spreadsheets/d/1y3uEaxhuoWrwe09uyYsHQpitwfXWwPRv9jh68GalXss/edit?usp=sharing

문제만이라도 다시 볼 수 있도록 하겠다는 공지가 있었지만, 만약의 상황에 대비하기 위해 웨이백 머신에 백준의 모든 문제를 보존하려고 합니다. 34500개나 되는 문제를 혼자서 모두 보존하기는 어렵기 때문에, 이 글을 보고 계시는 여러분의 도움을 받기 위해 시트를 만들었습니다. 해당 시트는 이후 백준 접속 가능 여부나 시트 완성도와 상관없이 서비스 종료 이후에도 유지할 예정입니다.

링크를 눌러서 기여 방법을 읽어주신 뒤에 시트에 보존 상황을 입력해 주시면 감사하겠습니다. 16년 동안 사이트를 운영해 주신 최백준님께도 감사의 말씀을 드립니다. 🙇

수정: 시트 기여 시 백준 서버에 무리를 줄 정도의 지나친 아카이빙은 자제해 주시기 바랍니다. https://www.acmicpc.net/board/...

bubbler   10일 전

웨이백 머신의 SPN2 API를 써서 자동 아카이빙 돌리는 중입니다. 현재 1000번부터 5999번까지 돌아갔는데요, 다만 일부는 서버 상태가 좋지 않은 시간에 돌아갔기 때문에 문제 내용이 아닌 404가 아카이브되었을 가능성이 있고, 첨부 파일 링크는 자동으로 캐치를 못하는거 같아서 수동으로 가능한 많은 첨부파일을 추가로 아카이빙하려고 하고 있습니다.

peterdo09   9일 전

근데 궁금한게 있는데요

여기에 보존하면 문제 제출도 가능한가요?

아니면 그냥 문제만 보존인가요?

bubbler   9일 전

@peterdo09 문제 지문만 보존됩니다. 일단 채점 데이터가 있어야 채점 시스템을 구현하든 말든 할텐데 채점 데이터가 비공개라서요

dlaud5379   9일 전

@peterdo09 추가로 웨이백 머신은 비로그인 상태에서 볼 수 있는 만큼만 보존해주기 때문에 solved.ac 티어/태그나 다국어 지문 역시 보존이 어렵습니다. 전자의 경우에는 solved.ac에서 계속 확인할 수 있을 것이라고 기대하고 있습니다.

테스트케이스는 뭐 어떻게든 문제에 맞게 재생성하면 어찌저찌 되는 게 아니겠습니까. 테케 공개 전환이 베스트긴 한데 지금 상황에서 어려울 것 같으니 지문이라도 건지는 데에 희망을 걸어야

bubbler   8일 전

돌다 보니 알게 된건데 3045, 3064 같이 브라우저로 열면 문제가 잘 보이는데 웨이백 머신에 api를 날리면 404만 나오는 경우가 있는거 같네요... 이거 해결 방법이 있을까요?

parkpill26   8일 전

안녕 하세요, 지속적으로 알고리즘 공부 및 훈련을 하고 잇는 학생인데요, 웨이벡 머신에 접근할 수 있는 주소를 알 수 있을까요?

dlaud5379   8일 전

@parkpill26 https://web.archive.org/ 에 접속하면 원하는 문제의 링크를 입력해서 기존에 있는 아카이브를 조회하거나 새로 저장할 수 있습니다. 다만 문제 번호와 링크를 기억해야 하고, 오류 페이지만 보존되었거나 아예 누락된 경우도 많기 때문에 별도로 시트를 만들어서 검증된 아카이브 링크를 모으고 있습니다.

시트 표지에 링크한 브라우저 확장을 설치하면 웨이백 머신 아카이브를 조금 더 편리하게 찾아볼 수 있습니다.

dlaud5379   8일 전

@bubbler 저는 파이어폭스 확장으로 스냅샷을 찍고 있고 비슷하게 오늘 아침에 21295번이 저장이 안 되는 증상을 겪었는데, 방금 다시 시도해보니 3045, 3064, 21295 모두 문제 없이 저장되는 것을 확인했습니다. 그나마 2024년 이전 날짜로 아카이브가 있는 문제가 꽤 있기도 하고, 그렇지 않더라도 다른 분들이 빈칸을 채워주실 수도 있을 것이라고 생각합니다.

mirusu400   7일 전

https://archive.org/services/w...


위처럼 스프레드 시트 형태로도 Batch 아카이브 가능합니다

다만 이경우 관리가 좀 불편하긴 하더라고요

bubbler   6일 전

@maga32 혹시 출처 페이지도 백업 가능할까요? category/1162, category/detail/4697까지 하면 될 거 같은데, 가능하다면 출처 페이지에 붙어있는 에디토리얼 파일(외부 링크는 제외)까지 보존되면 좋을 거 같습니다.

bubbler   6일 전

@maga32 그리고 1165번, 8481번, 20000번, 30000번에서 확인 가능한 링크 유형들이 보존되지 않은 것으로 보입니다. 이들 링크는 아래와 같이 생겼습니다. (onlinejudgeimages 링크는 다른 몇몇 아웃풋온리 문제에도 등장하고, u.acmicpc.net 링크는 에디토리얼 파일 링크에 등장한다고 합니다.)

upcarry1   18시간 전

문제 지문이 존재하지만 404로 적혀 있어서(ex.18826, 18827) 아카이브 링크를 바꿨는데 아카이브 일자가 그대로 404로 유지됩니다.

dlaud5379   17시간 전

@upcarry1 제보해 주셔서 감사합니다😅 해당 시트는 원상복구가 되었고 다른 시트도 고장난 곳이 있는지 확인해 보겠습니다.

upcarry1   17시간 전

@dlaud5379

감사합니다!

댓글을 작성하려면 로그인해야 합니다.