سلامی و علیکی.
عارضم که جمعه است. جمعه خود را با *** شروع نمودم. وای چه قدر خوبه دیه پست هام رو رمز دار کردم و میتونم هر چی دلم میخواد بگم. از این بیان باید جمع کنم و برم یه جای دیه ارشیو پست هام رو داشته باشم. من که برای کسی نمینویسم پس به نظرم دلیلی هم نیست که متن همه پست هام رو یه جایی توی اینترنت داشته باشم.
متن بالا رو نوشتم. به نشانه اعتراض رفتم و پس از ماه ها بدون جی پی تی دست به کد شدم و این چند خط رو نوشتم
# %%
import pandas as pd
import requests as req
from bs4 import BeautifulSoup as bs
# %%
url = r"https://livelaughlove.blog.ir"
resp = req.get(url)
# %%
soup = bs(resp.text,'html')
# %%
matn = [
{
'title': div.find('h2').find('a').text.strip() if div.find('h2') and div.find('h2').find('a') else '',
'content': [p.text.strip() for p in div.find_all('p')]
}
for div in soup.find_all('div', class_='post-content-right')
]
# %%
html_content = """
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>پستها</title>
</head>
<body>
"""
for item in matn:
html_content += f"<h1>{item['title']}</h1>\n"
for text in item['content']:
html_content += f"<p>{text}</p>\n"
html_content += """
</body>
</html>
"""
with open(r"posts.html", "w", encoding="utf-8") as f:
f.write(html_content)
اگر نیاز به این دارید که متن و عنوان هم پست هاتون رو داشته باشید همه رو بیارین صفحه اول و ادرس تون رو بزارید به جای لینک ادرس من. مسیر خروجی رو هم بهش بدید. اینجوری یه فایل اچ تی ام ال بهتون میده که اگه با ورد بازش کنید یه فایل تمیز و مرتبی میشه. خود بیانم ارشیو رو میده که اون رو باز کنید یکم شلخته پلخته تره.
این عمل به نیت نه به خود سانسوری صورت میگیره و از طرفی اینجا نوشتنمم مزیتی برام ندارهر هیچ موقع توی وبلاگ های به روز شده که نزدم بره و به نظرم به توی همین ورد نوشتن اکتفا کنم بهتره. الکی اطلاعات هم در سطح اینترنت منتشر نکردم:)
لاکن این اخرین پست هست و میزنم که وبلاگ به ابدیت بپیونده و پاک بشه. با توجه به اینکه متن پست هام رو هم دارم دیه برام مهم نیست.
خدافظ شما