Capture/Main.py at master · Biswa24/Capture · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
from PIL import Image
import os
from os import environ,listdir
from selenium import webdriver
from Screenshot import Screenshot_Clipping
from datetime import datetime
import validators
import requests


ob=Screenshot_Clipping.Screenshot()

img_dir = './static/img/'
pdf_dir = './static/pdf/'

def http_checker(url):
	if url.startswith('http'):
		return url
	url = 'http://' + url
	return url

def url_check(url):
# 	url = http_checker(url = url)
	valid = validators.url(url)
	if valid == True:
		try:
			response = requests.get(url)
			if response.status_code == 200:
				return 'Web'
			elif response.status_code == 404:
				return 'Error 404 Not found'
			else:
				return 'URL website down'
		except:
			return 'Does not exist'
	else:
		return 'Invalid URL'


def img_gen(url):
	if url == None :
		return

	chrome_options = webdriver.ChromeOptions()
	chrome_options.binary_location = os.environ.get("GOOGLE_CHROME_BIN")
	chrome_options.add_argument("--headless")
	chrome_options.add_argument("--disable-dev-shm-usage")
	chrome_options.add_argument("--no-sandbox")

	if os.environ['FLASK_ENV'] == 'development':
		DRIVER = ('./chromedriver/chromedriver_mac')
		# DRIVER = ('./chromedriver/chromedriver_linux')
		driver = webdriver.Chrome(DRIVER)
	else:
		driver = webdriver.Chrome(executable_path=os.environ.get("CHROMEDRIVER_PATH"),chrome_options=chrome_options)

	driver.get(url)
	img_name =  str(datetime.now().replace(microsecond=0)) +".png"
	img_path = os.path.join(img_dir,img_name)
	# img_url=ob.full_Screenshot(driver, save_path=img_dir, image_name=img_name)
	S = lambda X: driver.execute_script('return document.body.parentNode.scroll'+X)
	driver.set_window_size(S('Width'),S('Height'))
	driver.find_element_by_tag_name('body')
	driver.save_screenshot(img_path)
	driver.quit()
	return img_name

def pdf_gen(img_name):
	img_name = str(img_name).strip()
	img_path = os.path.join(img_dir, img_name)
	im1 = Image.open(img_path)
	#im1.show()
	im1 = im1.convert('RGB')
	img_name = img_name[:-3]+'pdf'
	pdf_path = os.path.join(pdf_dir, img_name)
	im1.save(r'{}'.format(pdf_path))
	return img_name


def delete(val,time_diff):

	if val =='img':
		dir = img_dir
	elif val == 'pdf':
		dir = pdf_dir
	else:
		print("Error")

	dir_name = listdir(dir)
	try :
		dir_name.remove('.DS_Store')
	except:
		pass
	files_name = [i[:-4] for i in dir_name]
	date_time_obj = [datetime.strptime(i, '%Y-%m-%d %H:%M:%S') for i in files_name]

	curr_time = datetime.now().replace(microsecond=0)

	difference = [(curr_time - i).total_seconds() for i in date_time_obj]
	if len(difference) == 0:
		print("No files")
		return

	time = time_diff*60

	for i,j in enumerate(difference):
		if j > time:
			img_path = os.path.join(dir,dir_name[i])
			os.remove(img_path)
			print("Deleted {} file".format(dir_name[i]))

	return