-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathdocumentatie_omp
47 lines (29 loc) · 1.13 KB
/
documentatie_omp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
Razvan Mitre 341C2
Eu am realizat paralelizarea prim OpenMP.
Cea mai mare problema pe care am intampinat-o a fost ca atunci cand imparteam
imaginea fiecarui thread, o imparteam in parti egale, si rezultatul nu iesea la
fel ca imaginea seriala. Dupa ce am studiat algoritmul in detaliu, mi-am dat
seama ca nu e de ajuns ca fiecare thread sa lucreze cu parti egale a imaginii,
ci mai este nevoie de 5 randuri de pixeli pentru a se putea detecta toate
marginile din imaginii.
Alte probleme nu am intampinat, algoritmul fiind potrivit pentru paralelizare.
Programul primeste ca parametrii nr de threaduri, imaginea de input si locatia
imaginii de output.
Pe coada ibm-opteron.q am obtinut:
serial: 2m 7.729s
omp 2 threads: 1m 8.415s
omp 4 threads: 0m 46.397s
omp 8 threads: 0m 37.222s
omp 16 threads: 0m 54.019s
Pe coada ibm-nehalem.q am obtinut:
serial: 1m 3.262s
omp 2 threads: 0m 33.691s
omp 4 threads: 0m 20.883s
omp 8 threads: 0m 13.006s
omp 16 threads: 0m 10.220s
Pe coada ibm-quad.q am obtinut:
serial: 1m 34.197s
omp 2 threads: 0m 48.905s
omp 4 threads: 0m 30.002s
omp 8 threads: 0m 18.979s
omp 16 threads: 0m 17.007s