הכל התחיל לפני מספר ימים. דבורית שרגל (בעלת הבלוג Velvet Underground שמתארח אגב, אצלנו) כתבה בקצרה על בעיה שיש לה: כאחת שנמצאת בתחום התקשורת, היא מקבלת לעיתים בקשות "דרושים" – חברות ועסקים בתחום התקשורת מחפשים אנשים מסויימים והיא מפרסמת את המודעות אצלה באתר (כאן). דבר מעולה, לדעתי.
רק ישנה בעיה קטנה: כמו שקורה במקרים רבים, תמיד יהיה מי שינסה לנצל את המצב בשביל לעשות עוד כמה שקלים וידפוק את האנשים הטובים בדרך. במקרה הזה מדובר בחברת All Jobs שפשוט החליטה להיכנס לאתר ולהעתיק את העבודות לטובת המנויים המשלמים שלהם. קרדיט לדבורית? משהו? חס ושלום! פשוט מעתיקים ללא בושה, גם כאשר דבורית ביקשה להפסיק – הם כלל לא מקשיבים.
מכיוון שעבדכם הנאמן קורא אדוק של אותו הבלוג, החלטתי לנסות לחפש פתרון לכך, פתרון שאולי יעזור גם לעוד מספר אנשים שמעוניינים לפרסם תוכן מסויים, אבל לא מעוניינים לתת לאנשים להעתיק את התוכן בצורה טקסטואלית, ועדיף גם לא לתת לגוגל לאנדקס ספציפית את אותו תוכן.
השיטה עצמה בתאוריה היא די פשוטה: הבה ננצל את הוורדפרס או כל מערכת אחרת דינמית, ונשתמש בספריית PHP (או כל שפה אחרת) ונהפוך את הטקסט ל-IMAGE. לא את כולו, רק את חלקו.
לאחר חיפושים, מצאתי תוסף מתאים. בהתחלה זה לא עבד, אך לאחר שיחה ומאמץ של המתכנת של התוסך, ישנו תוסף שעושה את העבודה ובצורה טובה. התוסף נקרא Image Text.
לאחר שמתקינים את התוסף, יש לבצע מספר דברים פשוטים:
- יש להגדיר בתוסף עצמו את גודל הריבוע שבו הטקסט יופיע. כדאי לשים לב, גודל קטן מדי יגרום לטקסט להופיע רק בחלקו.
- אפשר להגדיר כל מיני אספקטים של רקע, CSS וכו'
- לאחר שהכל הוגדר, אפשר לכתוב את הפוסט והיכן שרוצים שהטקסט יהפך לתמונה, מכניסים [imgtxt type=text]התוכן המוגן שלי[/imgtxt]
- התוסף גם מאפשר לחובבי ה-Latex ואלו המעוניינים ליצור קוד QR לעשות זאת בקלות ישירות מהבלוג (מעולה לסקירות).
זהו. אחרי שהפוסט מתפרסם (אפשר גם במצב Preview) הטקסט שסימנתם עם הקידוד יהפך לתמונה. יהיה אפשר כמובן לשמור את התמונה, אבל מי שירצה את הטקסט, יצטרך לקודד אותו מחדש או להשקיע בפתרון OCR.
תהנו.
כי תמונות זה דבר נגיש לכולם, ואז מי שעם קורא מסך, יוכל להבין מה "כתוב" …
ישנם מספר דרכים להתמודד עם התופעה. זו לא הדרך. לפחות ללא משהו שיאפשר גם להקריא את הטקסט המבוקש.
כמו כן, אם זה כתוב באותיות שOCR מסוגל לפענח (למשל hocr), אז זה לא בדיוק פתר לך את הבעיה.
על כל מחסום שתשים, מי שבאמת רוצה להצליח לפתוח אותו יצליח.
אני מסכים אתך שזה לא אידאלי – אבל זרקת אמירה באוויר ולא נתת רעיונות אחרים לפתרון הבעיה.
אגב, מעבר למה שאמרת, באותה מידה חברה יכולה להציב איזה הודי שישב ויקליד את הטקסט – ולא משנה באיזה שיטה תסתיר אותה. כמו שאמרת, לכל מחסום יש פתרון, השאלה היא מה רמת הקושי של המחסום, ולהפוך את הטקסט לתמונה, לעניות דעתי, זה מחסום לא רע בכלל אם איזה בוט רץ על רשימת אתרים ואוסף מהם טקסטים.
הי, חץ
אכן רכיב טוב, אבל הוא מבוסס על google charts tools שלא יתמך לעוד הרבה זמן.
ראה כאן:
https://developers.google.com/chart/image/
למה לא להשתמש עם robots.txt ?
לשים את מודעת הדרושים ב IFRAME, שיש עליו "צו איסור פרסום" למנועי החיפוש
נ.ב. זה לא יעזור אחרי ש"גילו" את העובדה שהבלוג הוא מקור להודעות דרושים.
אבל זה ימנע מלהגיע אליו באמצעות מנוע חיפוש.
כמו שנכתב בתגובה הראשונה, הבעיה הגדולה עם הפתרון היא שזה לא נגיש ולא בר חיפוש או העתקה (וגם די מכוער למען האמת) למשתמש הרגיל. אתה למעשה פוגע במשתמשים שלך כדי להגן על הזכויות של עצמך (מישהו אמר DRM?).
ישנן דרכים אחרות, פשוטות פחות אמנם אבל שלא פוגעות בחוויית המשתמש,
למשל:
לינק נוסף אל הפרטים סטייל יד2
חסימת רובוטים, חסימת כתובות IP מסויימות, חסימת user agents לא סטנדרטים וכו'
חסימת לינקים חיצוניים ו"בדיקת אנושיות" כלשהי בכניסה לעמוד
לא לפרסם את הפרטים אלא לתת לינק לשליחת מייל עם מס' משרה או הודעות/קו"ח דרך מערכת ההודעות של הבלוג (כמו שניוזגיק עושים פה – http://geekjob.co.il/)
ועוד.
כולם משפיעים על חוויית המשתמש אבל ניתן ליישם אותם בצורה זורמת ולא מורגשת הרבה יותר מהפתרון שלך.