คลังเก็บป้ายกำกับ: INTERNET_ARCHIVE

Tucows เว็บดาวน์โหลดฟรีแวร์-แชร์แวร์ยุค 90s ปิดบริการแล้วหลังเปิดมานาน 28 ปี

Tucows เว็บไซต์วัวสองตัว ตำนานแห่งการดาวน์โหลดฟรีแวร์-แชร์แวร์ของอินเทอร์เน็คยุค 90s ประกาศปิดหน้าเว็บส่วนดาวน์โหลด หลังให้บริการมานาน 28 ปี (นับจากปี 1993)

ปัจจุบัน Tucows กลายมาเป็นบริษัทแม่ของธุรกิจด้านโดเมนเนม (เป็นอันดับสองรองจาก GoDaddy) มีเว็บไซต์เกี่ยวกับโดเมนเนมหลายแห่ง เช่น Hover, OpenSRS, Enom, epag.de, ascio.com และขยายไปทำธุรกิจไฟเบอร์ในสหรัฐชื่อว่า Ting ด้วย ตัวบริษัทแม่อยู่ในตลาดหลักทรัพย์ Nasdaq โดยใช้ชื่อย่อว่า TCX

สิ่งที่ Tucows ปิดบริการมีแค่หน้า Tucows Download เท่านั้น ด้วยเหตุผลว่าเปลี่ยนไปทำธุรกิจอื่นหมดแล้ว การรักษาหน้าเว็บเดิมไว้กลายเป็นภาระในการดูแล โดยไฟล์ของซอฟต์แวร์หลายตัวจะถูกบริจาคให้ Internet Archive เพื่อประโยชน์ในการเก็บรักษาประวัติศาสตร์

ชื่อ TUCOWS ในตอนแรกสุด เป็นชื่อย่อของคำว่า The Ultimate Collection of Winsock Software ซึ่งเป็นแหล่งดาวน์โหลดซอฟต์แวร์ตระกูล Winsock ที่โด่งดังในยุคแรกๆ ของอินเทอร์เน็ต

No Description

ภาพหน้าแรกของ TUCOWS ในปี 1998

ที่มา – Tucows

from:https://www.blognone.com/node/120861

Internet Archive ใช้ Ruffle จำลอง Flash รันเว็บเก่าที่ไม่ได้อัพเดต

Internet Archive ประกาศนำอีมูเลเตอร์แฟลชที่ชื่อว่า Ruffle มารันแฟลชสำหรับเว็บเก่า ๆ หลัง Adobe Flash เตรียมจะยุติการสนับสนุนในปีนี้ และเบราว์เซอร์ส่วนใหญ่ก็ไม่รันโดยดีฟอลต์แล้ว

Ruffle เขียนโดยภาษา Rust และรองรับ WebAssembly สามารถรันได้บนทุกเบราว์เซอร์บนแซนด์บ็อกซ์ ซึ่ง Jason Scott เจ้าของเว็บ Internet Archive ยอมรับว่าแม้ Ruffle อาจจะไม่ได้รองรับ Flash ได้ 100% แต่ก็สามารถเล่นแอนิเมชันได้เป็นส่วนใหญ่

ที่มา – Internet Archive

No Description

from:https://www.blognone.com/node/119714

Internet Archive จะแสดงข้อมูลจากระบบตรวจสอบความจริงบน Wayback Machine เพื่ออธิบายเหตุผลที่หน้าเว็บถูกนำออกจากระบบ

Internet Archive ประกาศแสดงรายละเอียดและข้อมูลจากระบบตรวจสอบความจริงใน Wayback Machine เพื่อให้ข้อมูลผู้อ่านหน้าเว็บบนระบบว่าทำไมหน้านี้จึงหายไปจากระบบ

โดยปกติแล้ว Wayback Machine คือเป็นระบบที่เอาไว้เก็บข้อมูลหน้าเว็บเก่า ๆ เพื่อรักษาประวัติศาสตร์บนเว็บไซต์ให้คนที่สนใจมาค้นคว้าศึกษาได้เหมือนกับค้นคว้าห้องสมุด แต่ตัว Wayback Machine เองก็ไม่ได้ระบุว่าเพราะเหตุใดหน้าเว็บจึงหายไป ทาง Internet Archive ผู้ดูแล Wayback Machine จึงเกิดไอเดียที่จะทำแบนเนอร์ระบุไว้หากเป็นหน้าเว็บที่ถูกนำออกด้วยเหตุผลด้านข้อมูลผิด หรือการฝ่าฝืนนโยบาย โดยหากหน้าเว็บนั้นเป็นข้อมูลผิด Wayback Machine จะแสดงลิงก์อ้างอิงไปยังแหล่งข้อมูลที่ถูกต้อง หรือถ้าเป็นหน้าเว็บที่ถูกนำออกเนื่องจากฝ่าฝืนนโยบายของแพลตฟอร์ม จะแสดงลิงก์อ้างอิงไปยังนโยบายของแพลตฟอร์มดังกล่าว

Internet Archive ระบุว่าทางองค์กรจะเลือกใช้ข้อมูลจากบริการตรวจสอบความจริงหลาย ๆ แหล่งเข้ามาพิจารณาติดแบนเนอร์ เช่น FactCheck.org, Politifact, AP และ Washington Post เพื่อให้ผู้ที่ทำการศึกษาค้นคว้า Wayback Machine รับทราบข้อมูลเกี่ยวกับสิ่งที่ตัวเองกำลังอ่านได้ชัดเจนยิ่งขึ้น

ที่มา – Internet Archive, Engadget

No Description
ตัวอย่างบล็อกโพสต์ Medium ที่ถูกนำออกเนื่องจากเหตุผลการให้ข้อมูลผิดจะแสดงแบนเนอร์สีเหลืองไว้อย่างชัดเจน

Topics: 

from:https://www.blognone.com/node/119372

Cloudflare รวมมือ Internet Archive เอาเว็บเก่ามาแสดงแทนหากเว็บล่ม

Cloudflare ประกาศความร่วมมือกับ Internet Archive เตรียมให้บริการ Always Online เวอร์ชั่นใหม่แก้ปัญหาเวลาที่เว็บต้นทาง (origin) ล่มไป จากเดิมที่ Cloudflare จะแสดงหน้าจอแจ้งผู้ใช้ว่าเซิร์ฟเวอร์ต้นทางทำงานผิดพลาด มาเป็นการนำเว็บเก่าจาก Wayback Machine ของ Internet Archive ขึ้นมาแสดงแทนที่ไปพลาง

ผู้ใช้ต้องเปิดใช้งาน Always Online บน Cloudflare เอง และเมื่อเปิดใช้งานแล้วทาง Cloudflare จะส่งข้อมูลบางส่วนไปยัง Wayback Machine เช่นหน้าเว็บที่ผู้ใช้เข้ามากที่สุดเพื่อให้ Wayback Machine เลือกมาดูดหน้าเว็บได้แม่นยำขึ้น หากเว็บล่มไปทาง Cloudflare ก็จะเลือกเวอร์ชั่นล่าสุดมาแสดงให้

Always Online มีมาก่อนหน้านี้แล้ว แต่ก่อนนี้จะใช้แคชจาก Cloudflare เองซึ่งมีข้อมูลจำกัด ทำให้แสดงหน้าเว็บเมื่อเซิร์ฟเวอร์ล่มได้ไม่ครบถ้วน การใช้ Wayback Machine น่าจะทำให้ผู้ใช้เห็นข้อมูลส่วนใหญ่บนเว็บเสมอแม้จะเป็นข้อมูลเก่าไปบ้างก็ตาม

ที่มา – Cloudflare

No Description

from:https://www.blognone.com/node/118560

Cloudflare จับมือ Internet Archive ให้บริการ ‘Always Online’

Cloudflare ได้นำเสนอบริการใหม่ที่ช่วยให้ผู้ชมเว็บไซต์สามารถได้เนื้อหากลับมาเสมอแม้ว่าเซิร์ฟเวอร์จริงอาจจะล่มไปแล้ว

Internet Archive คือองค์กรไม่แสวงหาผลกำไรที่ให้บริการ Wayback Machine โดยมีหน้าที่หลักคือทำ Snapshot หน้าเว็บไซต์เก็บเอาไว้ ซึ่งเริ่มดำเนินการมาตั้งแต่ปี 1996 จนปัจจุบันมี Archive ของเว็บไซต์หลายพันล้านเก็บเอาไว้ ในข้อมูลขนาดกว่า 45 เพนตะไบต์แล้ว 

อย่างไรก็ดีไอเดียของ Cloudflare ก็คือการใช้ Archive ของหน้าเว็บลูกค้าส่งกลับไปหาผู้ชมเมื่อแน่ใจแล้วว่าเซิร์ฟเวอร์จริงร่วงไป โดย Internet Archive จะถูกผนวกเข้าในกระบวนการการให้บริการของ Cloudflare ดังนี้

credit : Cloudflare

1.) รับ Request มาจากผู้ชม

2.) Cloudflare ตรวจสอบดูว่ามี Content ในเซิร์ฟเวอร์แคชใกล้ผู้ชมไหม หากมีก็ตอบกลับไป หากไม่มีหรือเนื้อหาไม่อัปเดตก็ค่อยไปเรียกเซิร์ฟเวอร์จริงต่อ

3.) ถ้าเซิร์ฟเวอร์ไม่ตอบสนองในคาบเวลาจน Cloudflare แน่ใจแล้ว่าเซิร์ฟเวอร์ล่มจริง แทนที่จะคืนค่า Error ก็ไปขอข้อมูลที่ Internet Archive มาแสดงแทน

อย่างไรก็ตาม Cloudflare จะแปะเนื้อหาไว้ว่าตอนนี้ข้อมูลที่ชมอยู่ไม่ใช่ตัวอัปเดตนะ หากต้องการก็ Refresh พยายามเรียกข้อมูลจริงได้ว่าเซิร์ฟเวอร์อาจจะกลับมาแล้ว และผู้ใช้งาน Cloudflare ก็สามารถเริ่มต้นเปิดฟีเจอร์นี้ง่ายๆ ด้วย ตามภาพประกอบด้านล่าง

สำหรับสิ่งที่ผู้ใช้ต้องแชร์ข้อมูลกับ Internet Archive ก็คือ Hostname และ URL หลัก เพื่อใช้ทำ Archive แต่สบายใจได้ว่าข้อมูลของท่านจะไม่สามารถขุดค้นได้จากตัวขุด Archive สำหรับทาง Internet Archive ก็จะได้ข้อมูลสำหรับบันทีกเพิ่มเข้ามา จะเห็นได้ว่าได้ประโยชนืกันทุกฝ่ายนั่นเอง

credit : Cloudflare

ที่มา : https://blog.cloudflare.com/cloudflares-always-online-and-the-internet-archive-team-up-to-fight-origin-errors/

from:https://www.techtalkthai.com/cloudflare-cooperate-with-internet-archive-to-serve-always-online/

Wikipedia ร่วมมือ Internet Archive เพิ่มลิงก์ไปยังหนังสือ กดลิงก์แล้วแสดงหน้าตัวอย่าง

Wikipedia ร่วมมือกับ Internet Archive แปลงลิงก์บน Wikipedia ที่อ้างอิงถึงหนังสือ ให้กลายเป็นลิงก์ในยังเว็บเก็บภาพแสกนหนังสือโดยตรง ทำให้ตรวจสอบได้ทันทีว่าอ้างอิงถูกต้องหรือไม่

ตอนนี้ทาง Internet Archive แสกนหนังสือแล้ว 50,000 เล่ม และความร่วมมือครั้งนี้ก็แปลงการอ้างอิงบน Wikipedia เป็นลิงก์ทั้งหมด 130,000 รายการ ผู้ใช้สามารถกดอ่านบางส่วนของหนังสือได้ทันที

ทาง Internet Archive ระบุว่าต้นทุนการแสกนหนังสืออยู่ที่เล่มละ 20 ดอลลาร์ และมีเป้าหมายที่จะแสกนหนังสือ 4 ล้านเล่มในอีกไม่กี่ปีข้างหน้า

ที่มา – Internet Archive

No Description

from:https://www.blognone.com/node/112931

Internet Archive ไล่เก็บโพสต์สาธารณะบน Google+ ก่อนปิดระบบถาวร

Google ประกาศวันปิด Google+ อย่างเป็นทางการแล้ว คือวันที่ 2 เมษายนนี้ ซึ่งหลังจากนั้น Google จะทยอยลบข้อมูล แต่ข้อมูลสำคัญบางอย่างก็อาจอยู่บน Google+ จนยากที่จะปล่อยให้ลบไปด้วย

วันนี้ ทางทีม ArchiveTeam และ Internet Archive ได้โพสต์ลง Reddit โดยระบุว่าตอนนี้กำลังไล่แคชข้อมูลบน Google+ อยู่ เพื่อรักษาโพสต์สาธารณะไว้ก่อนที่ Google จะทำการลบมันออกไปอย่างถาวร และจะให้ข้อมูลเหล่านี้ค้นหาได้ผ่าน Wayback Machine

ทางทีมเก็บข้อมูลได้ใช้สคริปต์ในการจับและแบคอัพเพื่อรักษาข้อมูลไว้ โดยจะมีผลเฉพาะโพสต์ที่เป็นสาธารณะ ไม่มีการแบคอัพโพสต์ที่ถูกกำหนดให้เป็นส่วนตัวหรือถูกลบไปแล้ว ซึ่งหากผู้ใช้คนไหนไม่ต้องการให้ข้อมูลจาก Google+ ของตัวเองถูกเก็บเข้าไปด้วย สามารถเข้าไปลบบัญชีหรือแจ้งให้ลบได้ตามวิธีนี้

ส่วนคอมเมนท์ใต้โพสต์นั้น ทางทีมเก็บข้อมูลระบุว่าจะไม่เก็บ comment threads ที่มีมากกว่า 500 คอมเมนท์ แต่จะเก็บรักษาไว้เป็น static HTML ดังนั้นจึงไม่รับประกันว่าการคุยกันใต้คอมเมนท์ยาว ๆ จะถูกเก็บไว้หมด ส่วนภาพและวิดีโอก็จะเก็บแต่ไม่ได้เก็บขนาดเต็มไว้

ที่มา – The Verge

No Description

from:https://www.blognone.com/node/108705

Internet Archive ร่วมกับชุมชนซ่อมลิงก์เสียบน Wikipedia ให้ชี้มาที่ Wayback Machine แล้วราว 9 ล้านลิงก์

Wikipedia นั้นเป็นแหล่งสารานุกรมออนไลน์ที่มักจะมีลิงก์อ้างอิงไปที่เว็บไซต์อื่น ๆ เสมอ แต่บ่อยครั้งที่เว็บไซต์ที่ Wikipedia อ้างถึงนั้นไม่มีตัวตนแล้วหรือลิงก์เสีย​ ซึ่ง Internet Archive ที่มีระบบเก็บข้อมูลเว็บไซต์ Wayback Machine ก็ได้เข้ามาช่วยแก้ปัญหานี้

Internet Archive ได้ร่วมกับชุมชน Wikipedia ทำบอทที่ชื่อว่า IABot รันบนเว็บไซต์ Wikipedia เพื่อค้นหาลิงก์เสีย ซึ่งเมื่อบอทเจอลิงก์เสียแล้วก็จะไปค้นใน Wayback Machine รวมถึง web archive อื่น ๆ และนำลิงก์ใหม่แปะลิงก์เข้าไปแทนลิงก์ที่เสียเหล่านั้น เพื่อทำให้ Wikipedia มีข้อมูลที่แม่นยำและตรวจสอบได้

ทาง Internet Archive บอกว่าได้รันบอทนี้มาแล้ว 3 ปีบนเว็บไซต์ Wikipedia ทั้งหมด 22 ภาษา ซึ่งจนถึงทุกวันนี้บอททั้งหมดสามารถแก้ไขลิงก์ได้แล้วกว่า 6 ล้านลิงก์ รวมถึงชุมชน Wikipedia ก็ช่วยกันแก้ลิงก์ไปแล้วกว่า 3 ล้านลิงก์ รวมเป็น 9 ล้านลิงก์ที่ตอนนี้ชี้ไปยัง Wayback Machine หรือบริการ web archive อื่น ๆ

การซ่อมลิงก์ของ Internet Archive และชุมชน Wikipedia นั้นถือว่าได้ผลที่น่าพอใจมาก โดยจะเห็นได้ว่าจากผลสำรวจการคลิกลิงก์บน Wikipedia ของ Wikimedia Foundation พบว่าลิงก์ที่ไปยัง Wayback Machine มียอดสูงที่สุด และสูงกว่าเว็บไซต์อันดับสองคือ books.google.com ถึง 3 เท่า และถ้าคิดเฉพาะลิงก์บน Wikipedia เวอร์ชันภาษาอังกฤษที่ชี้ไปยัง Wayback Machine จะมีการคลิกอยู่ที่ราว 25,000 ครั้งต่อวัน

ที่มา – Internet Archive

No Description
ภาพ Nirzar Pangarkar/Wikimedia Foundation, CC BY-SA 3.0

from:https://www.blognone.com/node/105641

Internet Archive รับบริจาคบิตคอยน์จาก Pineapple Fund มูลค่ากว่า 1 ล้านดอลลาร์

Internet Archive โครงการสร้างห้องสมุดอินเทอร์เน็ต ได้รับบริจาคจาก Pineapple Fund กองทุนซึ่งจัดตั้งโดยเศรษฐีบิตคอยน์ผู้ไม่เปิดเผยตัวตนเป็นบิตคอยน์ซึ่งคิดเป็นมูลค่ากว่า 1 ล้านดอลลาร์

กองทุน Pineapple Fund เป็นโครงการที่จัดตั้งขึ้นโดยมีจุดประสงค์เพื่อการบริจาคบิตคอยน์ โดยทางกองทุนสัญญาว่าจะบริจาคเงินเป็นบิตคอยน์มูลค่ากว่า 86 ล้านดอลลาร์ ซึ่งจนถึงวันนี้กองทุนได้บริจาคบิตคอยน์ไปแล้วคิดเป็นมูลค่ากว่า 18 ล้านดอลลาร์ให้กับองค์กร 13 แห่ง เช่น Charity Water, Electronic Frontier Foundation (EFF), Green Steps และอื่น ๆ ซึ่งนอกจาก Pineapple Fund แล้ว ก็ยังมีองค์กรอื่นที่บริจาคบิตคอยน์เพื่อทำการกุศลอีก อย่างเช่น BitGive Foundation

ผู้ก่อตั้ง Pineapple Fund ได้กล่าววว่า คุณจะทำอะไรเมื่อคุณมีเงินมากกว่ารายจ่ายของคุณ การบริจาคเงินส่วนมากนี้เพื่อเป็นการกุศลคือสิ่งที่ผมทำ

Internet Archive นั้นเกิดขึ้นในปี 1996 มีจุดประสงค์เพื่อการบันทึกข้อมูลต่าง ๆ เก็บไว้เป็นห้องสมุดบนอินเทอร์เน็ตที่ทุกคนสามารถดาวน์โหลดไปศึกษาได้ โดยโครงการสำคัญของ Internet Archive เช่น Wayback Machine เครื่องมือเก็บประวัติหน้าเว็บ

Katie Barrett ผู้จัดการการพัฒนาของ Internet Archive กล่าวว่า เราขอนับถือผู้บริจาคที่ใช้บิตคอยน์เพื่อการให้ และยินดีเป็นอย่างยิ่งที่ได้รับของขวัญนี้ การเข้าถึงเว็บไซต์, ซอฟต์แวร์, หนังสือ, เพลง และอื่น ๆ ถือเป็นภารกิจของเรา ของขวัญเหล่านี้จะช่วยให้มันเกิดขึ้นได้จริง

ที่มา – VentureBeat

No Description

ที่ตั้งสำนักงานใหญ่ Internet Archive ที่ 300 Funston Avenue in San Francisco ภาพจาก Wikipedia (Public Domain)

from:https://www.blognone.com/node/98658

Internet Archive แสดงความต้องการเก็บฐานข้อมูลเอกสารของศาลในสหรัฐฯ และเปิดให้ใช้ฟรี

Internet Archive โครงการสร้างห้องสมุดอินเทอร์เน็ตได้แสดงความต้องการเก็บเอกสาร PACER ซึ่งเป็นฐานข้อมูลเอกสารของศาลในสหรัฐฯ ที่เก็บไว้ให้คนทั่วไปเข้าถึงได้ แต่ต้องจ่ายเงินค่าดาวน์โหลดเอกสาร

เอกสาร PACER หรือ Public Access to Court Electronic Records คือฐานข้อมูลเอกสารของศาลสหรัฐฯ ซึ่งปล่อยให้คนทั่วไปเข้าถึงได้ มีข้อมูลจากทั้งศาลท้องถิ่น, ศาลอุธรณ์ และศาลล้มละลาย โดยข้อมูล PACER เปิดเข้าถึงในช่องทางออนไลน์ได้ตั้งแต่ปี 2001 แต่ผู้ใช้ต้องจ่ายเงินในการดาวน์โหลดในอัตราหนึ่งหน้า 10 เซนต์ หรือทั้งเล่ม 3 ดอลลาร์

ในปี 2010 นั้น Internet Archive จึงได้เปิดตัวโครงการ RECAP (คือ PACER เขียนย้อนกลับ) ร่วมมือกับ Center for Information Technology Policy ของ Princeton University เพื่อให้ผู้ใช้สามารถอัพโหลดเอกสารที่ซื้อจาก PACER มาแล้วให้ผู้ใช้คนอื่นอ่านได้ฟรี

ในตอนนี้ รัฐสภาสหรัฐฯ ได้เปิดรับความคิดเห็นเพื่อปรับปรุงระบบ PACER ซึ่งทาง Internet Archive โดยผู้ก่อตั้ง Brewster Kahle จึงได้ออกจดหมายเปิดผนึก โดยแสดงความต้องการว่าทาง ​Internet Archive ประสงค์จะเป็นผู้เก็บข้อมูล PACER เอง

Kahle เขียนจดหมายว่า ตอนนี้ Internet Archive ได้ให้บริการข้อมูลกว่า 30 กิกะบิตต่อวินาที ซึ่งข้อมูลที่เก็บไว้ทั้งหมดมีประมาณ 20 เพตะไบต์ การเก็บข้อมูลจาก PACER เป็นแค่ส่วนหนึ่งของเพตะไบต์เท่านั้นและไม่ได้ใช้แบนด์วิธเยอะกว่าเดิมมากนัก เรามีความจุพอที่จะเก็บข้อมูลนี้ และตอนนี้มีองค์กรหลายแห่งบนอินเทอร์เน็ตพร้อมจะนำข้อมูลเหล่านี้ไปทำให้เกิดประโยชน์เมื่อเปิดให้ใช้ข้อมูลโดยไม่มีข้อจำกัด

ที่มา – Internet Archive, VentureBeat

Topics: 

from:https://www.blognone.com/node/90063