Branch data Line data Source code
1 : : /*
2 : : * Generic BitBLT function for frame buffer with packed pixels of any depth.
3 : : *
4 : : * Copyright (C) June 1999 James Simmons
5 : : *
6 : : * This file is subject to the terms and conditions of the GNU General Public
7 : : * License. See the file COPYING in the main directory of this archive for
8 : : * more details.
9 : : *
10 : : * NOTES:
11 : : *
12 : : * This function copys a image from system memory to video memory. The
13 : : * image can be a bitmap where each 0 represents the background color and
14 : : * each 1 represents the foreground color. Great for font handling. It can
15 : : * also be a color image. This is determined by image_depth. The color image
16 : : * must be laid out exactly in the same format as the framebuffer. Yes I know
17 : : * their are cards with hardware that coverts images of various depths to the
18 : : * framebuffer depth. But not every card has this. All images must be rounded
19 : : * up to the nearest byte. For example a bitmap 12 bits wide must be two
20 : : * bytes width.
21 : : *
22 : : * Tony:
23 : : * Incorporate mask tables similar to fbcon-cfb*.c in 2.4 API. This speeds
24 : : * up the code significantly.
25 : : *
26 : : * Code for depths not multiples of BITS_PER_LONG is still kludgy, which is
27 : : * still processed a bit at a time.
28 : : *
29 : : * Also need to add code to deal with cards endians that are different than
30 : : * the native cpu endians. I also need to deal with MSB position in the word.
31 : : * Modified by Harm Hanemaaijer (fgenfb@yahoo.com) 2013:
32 : : * - Provide optimized versions of fast_imageblit for 16 and 32bpp that are
33 : : * significantly faster than the previous implementation.
34 : : * - Simplify the fast/slow_imageblit selection code, avoiding integer
35 : : * divides.
36 : : */
37 : : #include <linux/module.h>
38 : : #include <linux/string.h>
39 : : #include <linux/fb.h>
40 : : #include <asm/types.h>
41 : : #include "fb_draw.h"
42 : :
43 : : #define DEBUG
44 : :
45 : : #ifdef DEBUG
46 : : #define DPRINTK(fmt, args...) printk(KERN_DEBUG "%s: " fmt,__func__,## args)
47 : : #else
48 : : #define DPRINTK(fmt, args...)
49 : : #endif
50 : :
51 : : static const u32 cfb_tab8_be[] = {
52 : : 0x00000000,0x000000ff,0x0000ff00,0x0000ffff,
53 : : 0x00ff0000,0x00ff00ff,0x00ffff00,0x00ffffff,
54 : : 0xff000000,0xff0000ff,0xff00ff00,0xff00ffff,
55 : : 0xffff0000,0xffff00ff,0xffffff00,0xffffffff
56 : : };
57 : :
58 : : static const u32 cfb_tab8_le[] = {
59 : : 0x00000000,0xff000000,0x00ff0000,0xffff0000,
60 : : 0x0000ff00,0xff00ff00,0x00ffff00,0xffffff00,
61 : : 0x000000ff,0xff0000ff,0x00ff00ff,0xffff00ff,
62 : : 0x0000ffff,0xff00ffff,0x00ffffff,0xffffffff
63 : : };
64 : :
65 : : static const u32 cfb_tab16_be[] = {
66 : : 0x00000000, 0x0000ffff, 0xffff0000, 0xffffffff
67 : : };
68 : :
69 : : static const u32 cfb_tab16_le[] = {
70 : : 0x00000000, 0xffff0000, 0x0000ffff, 0xffffffff
71 : : };
72 : :
73 : : static const u32 cfb_tab32[] = {
74 : : 0x00000000, 0xffffffff
75 : : };
76 : :
77 : : #define FB_WRITEL fb_writel
78 : : #define FB_READL fb_readl
79 : :
80 : 1616 : static inline void color_imageblit(const struct fb_image *image,
81 : : struct fb_info *p, u8 __iomem *dst1,
82 : : u32 start_index,
83 : : u32 pitch_index)
84 : : {
85 : : /* Draw the penguin */
86 : : u32 __iomem *dst, *dst2;
87 : : u32 color = 0, val, shift;
88 : 1616 : int i, n, bpp = p->var.bits_per_pixel;
89 : 1616 : u32 null_bits = 32 - bpp;
90 : 1616 : u32 *palette = (u32 *) p->pseudo_palette;
91 : 1616 : const u8 *src = image->data;
92 : : u32 bswapmask = fb_compute_bswapmask(p);
93 : :
94 : : dst2 = (u32 __iomem *) dst1;
95 [ + + ]: 132512 : for (i = image->height; i--; ) {
96 : 129280 : n = image->width;
97 : : dst = (u32 __iomem *) dst1;
98 : : shift = 0;
99 : : val = 0;
100 : :
101 [ - + ]: 129280 : if (start_index) {
102 : 0 : u32 start_mask = ~fb_shifted_pixels_mask_u32(p,
103 : : start_index, bswapmask);
104 : 0 : val = FB_READL(dst) & start_mask;
105 : : shift = start_index;
106 : : }
107 [ + + ]: 8273920 : while (n--) {
108 [ + - ]: 8144640 : if (p->fix.visual == FB_VISUAL_TRUECOLOR ||
109 : : p->fix.visual == FB_VISUAL_DIRECTCOLOR )
110 : 8144640 : color = palette[*src];
111 : : else
112 : 0 : color = *src;
113 : : color <<= FB_LEFT_POS(p, bpp);
114 : 8144640 : val |= FB_SHIFT_HIGH(p, color, shift ^ bswapmask);
115 [ + - ]: 8144640 : if (shift >= null_bits) {
116 : 8144640 : FB_WRITEL(val, dst++);
117 : :
118 [ - + ]: 8144640 : val = (shift == null_bits) ? 0 :
119 : 0 : FB_SHIFT_LOW(p, color, 32 - shift);
120 : : }
121 : 8144640 : shift += bpp;
122 : 8144640 : shift &= (32 - 1);
123 : 8144640 : src++;
124 : : }
125 [ - + ]: 129280 : if (shift) {
126 : 0 : u32 end_mask = fb_shifted_pixels_mask_u32(p, shift,
127 : : bswapmask);
128 : :
129 : 0 : FB_WRITEL((FB_READL(dst) & end_mask) | val, dst);
130 : : }
131 : 129280 : dst1 += p->fix.line_length;
132 [ - + ]: 129280 : if (pitch_index) {
133 : 0 : dst2 += p->fix.line_length;
134 : 0 : dst1 = (u8 __iomem *)((long __force)dst2 & ~(sizeof(u32) - 1));
135 : :
136 : 0 : start_index += pitch_index;
137 : 0 : start_index &= 32 - 1;
138 : : }
139 : : }
140 : 1616 : }
141 : :
142 : 0 : static inline void slow_imageblit(const struct fb_image *image, struct fb_info *p,
143 : : u8 __iomem *dst1, u32 fgcolor,
144 : : u32 bgcolor,
145 : : u32 start_index,
146 : : u32 pitch_index)
147 : : {
148 : 0 : u32 shift, color = 0, bpp = p->var.bits_per_pixel;
149 : : u32 __iomem *dst, *dst2;
150 : 0 : u32 val, pitch = p->fix.line_length;
151 : 0 : u32 null_bits = 32 - bpp;
152 : 0 : u32 spitch = (image->width+7)/8;
153 : 0 : const u8 *src = image->data, *s;
154 : : u32 i, j, l;
155 : : u32 bswapmask = fb_compute_bswapmask(p);
156 : :
157 : : dst2 = (u32 __iomem *) dst1;
158 : : fgcolor <<= FB_LEFT_POS(p, bpp);
159 : : bgcolor <<= FB_LEFT_POS(p, bpp);
160 : :
161 [ # # ]: 0 : for (i = image->height; i--; ) {
162 : : shift = val = 0;
163 : : l = 8;
164 : : j = image->width;
165 : : dst = (u32 __iomem *) dst1;
166 : : s = src;
167 : :
168 : : /* write leading bits */
169 [ # # ]: 0 : if (start_index) {
170 : 0 : u32 start_mask = ~fb_shifted_pixels_mask_u32(p,
171 : : start_index, bswapmask);
172 : 0 : val = FB_READL(dst) & start_mask;
173 : : shift = start_index;
174 : : }
175 : :
176 [ # # ]: 0 : while (j--) {
177 : 0 : l--;
178 [ # # ]: 0 : color = (*s & (1 << l)) ? fgcolor : bgcolor;
179 : 0 : val |= FB_SHIFT_HIGH(p, color, shift ^ bswapmask);
180 : :
181 : : /* Did the bitshift spill bits to the next long? */
182 [ # # ]: 0 : if (shift >= null_bits) {
183 : 0 : FB_WRITEL(val, dst++);
184 [ # # ]: 0 : val = (shift == null_bits) ? 0 :
185 : 0 : FB_SHIFT_LOW(p, color, 32 - shift);
186 : : }
187 : 0 : shift += bpp;
188 : 0 : shift &= (32 - 1);
189 [ # # ]: 0 : if (!l) { l = 8; s++; }
190 : : }
191 : :
192 : : /* write trailing bits */
193 [ # # ]: 0 : if (shift) {
194 : 0 : u32 end_mask = fb_shifted_pixels_mask_u32(p, shift,
195 : : bswapmask);
196 : :
197 : 0 : FB_WRITEL((FB_READL(dst) & end_mask) | val, dst);
198 : : }
199 : :
200 : 0 : dst1 += pitch;
201 : 0 : src += spitch;
202 [ # # ]: 0 : if (pitch_index) {
203 : 0 : dst2 += pitch;
204 : 0 : dst1 = (u8 __iomem *)((long __force)dst2 & ~(sizeof(u32) - 1));
205 : 0 : start_index += pitch_index;
206 : 0 : start_index &= 32 - 1;
207 : : }
208 : :
209 : : }
210 : 0 : }
211 : :
212 : : /*
213 : : * fast_imageblit - optimized monochrome color expansion
214 : : *
215 : : * Only if: bits_per_pixel == 8, 16, or 32
216 : : * image->width is divisible by pixel/dword (ppw);
217 : : * fix->line_legth is divisible by 4;
218 : : * beginning and end of a scanline is dword aligned
219 : : */
220 : 0 : static inline void fast_imageblit(const struct fb_image *image, struct fb_info *p,
221 : : u8 __iomem *dst1, u32 fgcolor,
222 : : u32 bgcolor)
223 : : {
224 : 0 : u32 fgx = fgcolor, bgx = bgcolor, bpp = p->var.bits_per_pixel;
225 : 0 : u32 ppw = 32/bpp, spitch = (image->width + 7)/8;
226 : : u32 bit_mask, end_mask, eorx, shift;
227 : 0 : const char *s = image->data, *src;
228 : : u32 __iomem *dst;
229 : : const u32 *tab = NULL;
230 : : int i, j, k;
231 : :
232 [ # # # ]: 0 : switch (bpp) {
233 : : case 8:
234 : : tab = fb_be_math(p) ? cfb_tab8_be : cfb_tab8_le;
235 : : break;
236 : : case 16:
237 : : tab = fb_be_math(p) ? cfb_tab16_be : cfb_tab16_le;
238 : 0 : break;
239 : : case 32:
240 : : default:
241 : : tab = cfb_tab32;
242 : 0 : break;
243 : : }
244 : :
245 [ # # ]: 0 : for (i = ppw-1; i--; ) {
246 : 0 : fgx <<= bpp;
247 : 0 : bgx <<= bpp;
248 : 0 : fgx |= fgcolor;
249 : 0 : bgx |= bgcolor;
250 : : }
251 : :
252 : 0 : bit_mask = (1 << ppw) - 1;
253 : 0 : eorx = fgx ^ bgx;
254 : 0 : k = image->width/ppw;
255 : :
256 [ # # ]: 0 : for (i = image->height; i--; ) {
257 : : dst = (u32 __iomem *) dst1, shift = 8; src = s;
258 : :
259 [ # # ]: 0 : for (j = k; j--; ) {
260 : 0 : shift -= ppw;
261 : 0 : end_mask = tab[(*src >> shift) & bit_mask];
262 : 0 : FB_WRITEL((end_mask & eorx)^bgx, dst++);
263 [ # # ]: 0 : if (!shift) { shift = 8; src++; }
264 : : }
265 : 0 : dst1 += p->fix.line_length;
266 : 0 : s += spitch;
267 : : }
268 : 0 : }
269 : :
270 : : /*
271 : : * Optimized fast_imageblit for bpp == 16. ppw = 2, bit_mask = 3 folded
272 : : * into the code, main loop unrolled.
273 : : */
274 : :
275 : 0 : static inline void fast_imageblit16(const struct fb_image *image,
276 : : struct fb_info *p, u8 __iomem * dst1,
277 : : u32 fgcolor, u32 bgcolor)
278 : : {
279 : : u32 fgx = fgcolor, bgx = bgcolor;
280 : 0 : u32 spitch = (image->width + 7) / 8;
281 : : u32 end_mask, eorx;
282 : 0 : const char *s = image->data, *src;
283 : : u32 __iomem *dst;
284 : : const u32 *tab = NULL;
285 : : int i, j, k;
286 : :
287 : : tab = fb_be_math(p) ? cfb_tab16_be : cfb_tab16_le;
288 : :
289 : 0 : fgx <<= 16;
290 : 0 : bgx <<= 16;
291 : 0 : fgx |= fgcolor;
292 : 0 : bgx |= bgcolor;
293 : :
294 : 0 : eorx = fgx ^ bgx;
295 : 0 : k = image->width / 2;
296 : :
297 [ # # ]: 0 : for (i = image->height; i--;) {
298 : : dst = (u32 __iomem *) dst1;
299 : : src = s;
300 : :
301 : : j = k;
302 [ # # ]: 0 : while (j >= 4) {
303 : 0 : u8 bits = *src;
304 : 0 : end_mask = tab[(bits >> 6) & 3];
305 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
306 : 0 : end_mask = tab[(bits >> 4) & 3];
307 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
308 : 0 : end_mask = tab[(bits >> 2) & 3];
309 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
310 : 0 : end_mask = tab[bits & 3];
311 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
312 : 0 : src++;
313 : 0 : j -= 4;
314 : : }
315 [ # # ]: 0 : if (j != 0) {
316 : 0 : u8 bits = *src;
317 : 0 : end_mask = tab[(bits >> 6) & 3];
318 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
319 [ # # ]: 0 : if (j >= 2) {
320 : 0 : end_mask = tab[(bits >> 4) & 3];
321 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
322 [ # # ]: 0 : if (j == 3) {
323 : 0 : end_mask = tab[(bits >> 2) & 3];
324 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst);
325 : : }
326 : : }
327 : : }
328 : 0 : dst1 += p->fix.line_length;
329 : 0 : s += spitch;
330 : : }
331 : 0 : }
332 : :
333 : : /*
334 : : * Optimized fast_imageblit for bpp == 32. ppw = 1, bit_mask = 1 folded
335 : : * into the code, main loop unrolled.
336 : : */
337 : :
338 : 149408 : static inline void fast_imageblit32(const struct fb_image *image,
339 : : struct fb_info *p, u8 __iomem * dst1,
340 : : u32 fgcolor, u32 bgcolor)
341 : : {
342 : : u32 fgx = fgcolor, bgx = bgcolor;
343 : 149408 : u32 spitch = (image->width + 7) / 8;
344 : : u32 end_mask, eorx;
345 : 149408 : const char *s = image->data, *src;
346 : : u32 __iomem *dst;
347 : : const u32 *tab = NULL;
348 : : int i, j, k;
349 : :
350 : : tab = cfb_tab32;
351 : :
352 : 149408 : eorx = fgx ^ bgx;
353 : 149408 : k = image->width;
354 : :
355 [ + + ]: 2689344 : for (i = image->height; i--;) {
356 : : dst = (u32 __iomem *) dst1;
357 : : src = s;
358 : :
359 : : j = k;
360 [ + + ]: 59175616 : while (j >= 8) {
361 : 56785088 : u8 bits = *src;
362 : 56785088 : end_mask = tab[(bits >> 7) & 1];
363 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
364 : 56785088 : end_mask = tab[(bits >> 6) & 1];
365 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
366 : 56785088 : end_mask = tab[(bits >> 5) & 1];
367 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
368 : 56785088 : end_mask = tab[(bits >> 4) & 1];
369 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
370 : 56785088 : end_mask = tab[(bits >> 3) & 1];
371 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
372 : 56785088 : end_mask = tab[(bits >> 2) & 1];
373 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
374 : 56785088 : end_mask = tab[(bits >> 1) & 1];
375 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
376 : 56785088 : end_mask = tab[bits & 1];
377 : 56785088 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
378 : 56785088 : src++;
379 : 56785088 : j -= 8;
380 : : }
381 [ - + ]: 2390528 : if (j != 0) {
382 : 0 : u32 bits = (u32) * src;
383 [ # # ]: 0 : while (j > 1) {
384 : 0 : end_mask = tab[(bits >> 7) & 1];
385 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst++);
386 : 0 : bits <<= 1;
387 : 0 : j--;
388 : : }
389 : 0 : end_mask = tab[(bits >> 7) & 1];
390 : 0 : FB_WRITEL((end_mask & eorx) ^ bgx, dst);
391 : : }
392 : 2390528 : dst1 += p->fix.line_length;
393 : 2390528 : s += spitch;
394 : : }
395 : 149408 : }
396 : :
397 : 151024 : void cfb_imageblit(struct fb_info *p, const struct fb_image *image)
398 : : {
399 : : u32 fgcolor, bgcolor, start_index, bitstart, pitch_index = 0;
400 : 151024 : u32 bpl = sizeof(u32), bpp = p->var.bits_per_pixel;
401 : 151024 : u32 width = image->width;
402 : 151024 : u32 dx = image->dx, dy = image->dy;
403 : : u8 __iomem *dst1;
404 : :
405 [ + - ]: 151024 : if (p->state != FBINFO_STATE_RUNNING)
406 : 151024 : return;
407 : :
408 : 151024 : bitstart = (dy * p->fix.line_length * 8) + (dx * bpp);
409 : 151024 : start_index = bitstart & (32 - 1);
410 : 151024 : pitch_index = (p->fix.line_length & (bpl - 1)) * 8;
411 : :
412 : 151024 : bitstart /= 8;
413 : 151024 : bitstart &= ~(bpl - 1);
414 : 151024 : dst1 = p->screen_base + bitstart;
415 : :
416 [ - + ]: 151024 : if (p->fbops->fb_sync)
417 : 0 : p->fbops->fb_sync(p);
418 : :
419 [ + + ]: 151024 : if (image->depth == 1) {
420 [ + - ]: 149408 : if (p->fix.visual == FB_VISUAL_TRUECOLOR ||
421 : : p->fix.visual == FB_VISUAL_DIRECTCOLOR) {
422 : 149408 : fgcolor = ((u32*)(p->pseudo_palette))[image->fg_color];
423 : 149408 : bgcolor = ((u32*)(p->pseudo_palette))[image->bg_color];
424 : : } else {
425 : 0 : fgcolor = image->fg_color;
426 : 0 : bgcolor = image->bg_color;
427 : : }
428 : :
429 [ + - ]: 149408 : if (!start_index && !pitch_index) {
430 [ + - ]: 149408 : if (bpp == 32)
431 : 149408 : fast_imageblit32(image, p, dst1, fgcolor,
432 : : bgcolor);
433 [ # # # # ]: 0 : else if (bpp == 16 && (width & 1) == 0)
434 : 0 : fast_imageblit16(image, p, dst1, fgcolor,
435 : : bgcolor);
436 [ # # # # ]: 0 : else if (bpp == 8 && (width & 3) == 0)
437 : 0 : fast_imageblit(image, p, dst1, fgcolor,
438 : : bgcolor);
439 : : else
440 : 0 : slow_imageblit(image, p, dst1, fgcolor,
441 : : bgcolor,
442 : : start_index, pitch_index);
443 : : } else
444 : 0 : slow_imageblit(image, p, dst1, fgcolor, bgcolor,
445 : : start_index, pitch_index);
446 : : } else
447 : 1616 : color_imageblit(image, p, dst1, start_index, pitch_index);
448 : : }
449 : :
450 : : EXPORT_SYMBOL(cfb_imageblit);
451 : :
452 : : MODULE_AUTHOR("James Simmons <jsimmons@users.sf.net>");
453 : : MODULE_DESCRIPTION("Generic software accelerated imaging drawing");
454 : : MODULE_LICENSE("GPL");
455 : :
|