v2.4.9.9 -> v2.4.9.10
[opensuse:kernel.git] / include / linux / fs.h
1 #ifndef _LINUX_FS_H
2 #define _LINUX_FS_H
3
4 /*
5  * This file has definitions for some important file table
6  * structures etc.
7  */
8
9 #include <linux/config.h>
10 #include <linux/linkage.h>
11 #include <linux/limits.h>
12 #include <linux/wait.h>
13 #include <linux/types.h>
14 #include <linux/vfs.h>
15 #include <linux/net.h>
16 #include <linux/kdev_t.h>
17 #include <linux/ioctl.h>
18 #include <linux/list.h>
19 #include <linux/dcache.h>
20 #include <linux/stat.h>
21 #include <linux/cache.h>
22 #include <linux/stddef.h>
23 #include <linux/string.h>
24
25 #include <asm/atomic.h>
26 #include <asm/bitops.h>
27
28 struct poll_table_struct;
29
30
31 /*
32  * It's silly to have NR_OPEN bigger than NR_FILE, but you can change
33  * the file limit at runtime and only root can increase the per-process
34  * nr_file rlimit, so it's safe to set up a ridiculously high absolute
35  * upper limit on files-per-process.
36  *
37  * Some programs (notably those using select()) may have to be 
38  * recompiled to take full advantage of the new limits..  
39  */
40
41 /* Fixed constants first: */
42 #undef NR_OPEN
43 #define NR_OPEN (1024*1024)     /* Absolute upper limit on fd num */
44 #define INR_OPEN 1024           /* Initial setting for nfile rlimits */
45
46 #define BLOCK_SIZE_BITS 10
47 #define BLOCK_SIZE (1<<BLOCK_SIZE_BITS)
48
49 /* And dynamically-tunable limits and defaults: */
50 struct files_stat_struct {
51         int nr_files;           /* read only */
52         int nr_free_files;      /* read only */
53         int max_files;          /* tunable */
54 };
55 extern struct files_stat_struct files_stat;
56
57 struct inodes_stat_t {
58         int nr_inodes;
59         int nr_unused;
60         int dummy[5];
61 };
62 extern struct inodes_stat_t inodes_stat;
63
64 extern int leases_enable, dir_notify_enable, lease_break_time;
65
66 #define NR_FILE  8192   /* this can well be larger on a larger system */
67 #define NR_RESERVED_FILES 10 /* reserved for root */
68 #define NR_SUPER 256
69
70 #define MAY_EXEC 1
71 #define MAY_WRITE 2
72 #define MAY_READ 4
73
74 #define FMODE_READ 1
75 #define FMODE_WRITE 2
76
77 #define READ 0
78 #define WRITE 1
79 #define READA 2         /* read-ahead  - don't block if no resources */
80 #define SPECIAL 4       /* For non-blockdevice requests in request queue */
81
82 #define SEL_IN          1
83 #define SEL_OUT         2
84 #define SEL_EX          4
85
86 /* public flags for file_system_type */
87 #define FS_REQUIRES_DEV 1 
88 #define FS_NO_DCACHE    2 /* Only dcache the necessary things. */
89 #define FS_NO_PRELIM    4 /* prevent preloading of dentries, even if
90                            * FS_NO_DCACHE is not set.
91                            */
92 #define FS_SINGLE       8 /* Filesystem that can have only one superblock */
93 #define FS_NOMOUNT      16 /* Never mount from userland */
94 #define FS_LITTER       32 /* Keeps the tree in dcache */
95 #define FS_ODD_RENAME   32768   /* Temporary stuff; will go away as soon
96                                   * as nfs_rename() will be cleaned up
97                                   */
98 /*
99  * These are the fs-independent mount-flags: up to 32 flags are supported
100  */
101 #define MS_RDONLY        1      /* Mount read-only */
102 #define MS_NOSUID        2      /* Ignore suid and sgid bits */
103 #define MS_NODEV         4      /* Disallow access to device special files */
104 #define MS_NOEXEC        8      /* Disallow program execution */
105 #define MS_SYNCHRONOUS  16      /* Writes are synced at once */
106 #define MS_REMOUNT      32      /* Alter flags of a mounted FS */
107 #define MS_MANDLOCK     64      /* Allow mandatory locks on an FS */
108 #define MS_NOATIME      1024    /* Do not update access times. */
109 #define MS_NODIRATIME   2048    /* Do not update directory access times */
110 #define MS_BIND         4096
111 #define MS_NOUSER       (1<<31)
112
113 /*
114  * Superblock flags that can be altered by MS_REMOUNT
115  */
116 #define MS_RMT_MASK     (MS_RDONLY|MS_SYNCHRONOUS|MS_MANDLOCK|MS_NOATIME|\
117                          MS_NODIRATIME)
118
119 /*
120  * Old magic mount flag and mask
121  */
122 #define MS_MGC_VAL 0xC0ED0000
123 #define MS_MGC_MSK 0xffff0000
124
125 /* Inode flags - they have nothing to superblock flags now */
126
127 #define S_SYNC          1       /* Writes are synced at once */
128 #define S_NOATIME       2       /* Do not update access times */
129 #define S_QUOTA         4       /* Quota initialized for file */
130 #define S_APPEND        8       /* Append-only file */
131 #define S_IMMUTABLE     16      /* Immutable file */
132 #define S_DEAD          32      /* removed, but still open directory */
133 #define S_NOQUOTA       64      /* Inode is not counted to quota */
134
135 /*
136  * Note that nosuid etc flags are inode-specific: setting some file-system
137  * flags just means all the inodes inherit those flags by default. It might be
138  * possible to override it selectively if you really wanted to with some
139  * ioctl() that is not currently implemented.
140  *
141  * Exception: MS_RDONLY is always applied to the entire file system.
142  *
143  * Unfortunately, it is possible to change a filesystems flags with it mounted
144  * with files in use.  This means that all of the inodes will not have their
145  * i_flags updated.  Hence, i_flags no longer inherit the superblock mount
146  * flags, so these have to be checked separately. -- rmk@arm.uk.linux.org
147  */
148 #define __IS_FLG(inode,flg) ((inode)->i_sb->s_flags & (flg))
149
150 #define IS_RDONLY(inode) ((inode)->i_sb->s_flags & MS_RDONLY)
151 #define IS_SYNC(inode)          (__IS_FLG(inode, MS_SYNCHRONOUS) || ((inode)->i_flags & S_SYNC))
152 #define IS_MANDLOCK(inode)      __IS_FLG(inode, MS_MANDLOCK)
153
154 #define IS_QUOTAINIT(inode)     ((inode)->i_flags & S_QUOTA)
155 #define IS_NOQUOTA(inode)       ((inode)->i_flags & S_NOQUOTA)
156 #define IS_APPEND(inode)        ((inode)->i_flags & S_APPEND)
157 #define IS_IMMUTABLE(inode)     ((inode)->i_flags & S_IMMUTABLE)
158 #define IS_NOATIME(inode)       (__IS_FLG(inode, MS_NOATIME) || ((inode)->i_flags & S_NOATIME))
159 #define IS_NODIRATIME(inode)    __IS_FLG(inode, MS_NODIRATIME)
160
161 #define IS_DEADDIR(inode)       ((inode)->i_flags & S_DEAD)
162
163 /* the read-only stuff doesn't really belong here, but any other place is
164    probably as bad and I don't want to create yet another include file. */
165
166 #define BLKROSET   _IO(0x12,93) /* set device read-only (0 = read-write) */
167 #define BLKROGET   _IO(0x12,94) /* get read-only status (0 = read_write) */
168 #define BLKRRPART  _IO(0x12,95) /* re-read partition table */
169 #define BLKGETSIZE _IO(0x12,96) /* return device size /512 (long *arg) */
170 #define BLKFLSBUF  _IO(0x12,97) /* flush buffer cache */
171 #define BLKRASET   _IO(0x12,98) /* Set read ahead for block device */
172 #define BLKRAGET   _IO(0x12,99) /* get current read ahead setting */
173 #define BLKFRASET  _IO(0x12,100)/* set filesystem (mm/filemap.c) read-ahead */
174 #define BLKFRAGET  _IO(0x12,101)/* get filesystem (mm/filemap.c) read-ahead */
175 #define BLKSECTSET _IO(0x12,102)/* set max sectors per request (ll_rw_blk.c) */
176 #define BLKSECTGET _IO(0x12,103)/* get max sectors per request (ll_rw_blk.c) */
177 #define BLKSSZGET  _IO(0x12,104)/* get block device sector size */
178 #if 0
179 #define BLKPG      _IO(0x12,105)/* See blkpg.h */
180 #define BLKELVGET  _IOR(0x12,106,sizeof(blkelv_ioctl_arg_t))/* elevator get */
181 #define BLKELVSET  _IOW(0x12,107,sizeof(blkelv_ioctl_arg_t))/* elevator set */
182 /* This was here just to show that the number is taken -
183    probably all these _IO(0x12,*) ioctls should be moved to blkpg.h. */
184 #endif
185 /* A jump here: 108-111 have been used for various private purposes. */
186 #define BLKBSZGET  _IOR(0x12,112,sizeof(int))
187 #define BLKBSZSET  _IOW(0x12,113,sizeof(int))
188 #define BLKGETSIZE64 _IOR(0x12,114,sizeof(u64)) /* return device size in bytes (u64 *arg) */
189
190 #define BMAP_IOCTL 1            /* obsolete - kept for compatibility */
191 #define FIBMAP     _IO(0x00,1)  /* bmap access */
192 #define FIGETBSZ   _IO(0x00,2)  /* get the block size used for bmap */
193
194 #ifdef __KERNEL__
195
196 #include <asm/semaphore.h>
197 #include <asm/byteorder.h>
198
199 extern void update_atime (struct inode *);
200 #define UPDATE_ATIME(inode) update_atime (inode)
201
202 extern void buffer_init(unsigned long);
203 extern void inode_init(unsigned long);
204 extern void mnt_init(unsigned long);
205
206 /* bh state bits */
207 enum bh_state_bits {
208         BH_Uptodate,    /* 1 if the buffer contains valid data */
209         BH_Dirty,       /* 1 if the buffer is dirty */
210         BH_Lock,        /* 1 if the buffer is locked */
211         BH_Req,         /* 0 if the buffer has been invalidated */
212         BH_Mapped,      /* 1 if the buffer has a disk mapping */
213         BH_New,         /* 1 if the buffer is new and not yet written out */
214         BH_Protected,   /* 1 if the buffer is protected */
215
216         BH_PrivateStart,/* not a state bit, but the first bit available
217                          * for private allocation by other entities
218                          */
219 };
220
221 /*
222  * Try to keep the most commonly used fields in single cache lines (16
223  * bytes) to improve performance.  This ordering should be
224  * particularly beneficial on 32-bit processors.
225  * 
226  * We use the first 16 bytes for the data which is used in searches
227  * over the block hash lists (ie. getblk() and friends).
228  * 
229  * The second 16 bytes we use for lru buffer scans, as used by
230  * sync_buffers() and refill_freelist().  -- sct
231  */
232 struct buffer_head {
233         /* First cache line: */
234         struct buffer_head *b_next;     /* Hash queue list */
235         unsigned long b_blocknr;        /* block number */
236         unsigned short b_size;          /* block size */
237         unsigned short b_list;          /* List that this buffer appears */
238         kdev_t b_dev;                   /* device (B_FREE = free) */
239
240         atomic_t b_count;               /* users using this block */
241         kdev_t b_rdev;                  /* Real device */
242         unsigned long b_state;          /* buffer state bitmap (see above) */
243         unsigned long b_flushtime;      /* Time when (dirty) buffer should be written */
244
245         struct buffer_head *b_next_free;/* lru/free list linkage */
246         struct buffer_head *b_prev_free;/* doubly linked list of buffers */
247         struct buffer_head *b_this_page;/* circular list of buffers in one page */
248         struct buffer_head *b_reqnext;  /* request queue */
249
250         struct buffer_head **b_pprev;   /* doubly linked list of hash-queue */
251         char * b_data;                  /* pointer to data block */
252         struct page *b_page;            /* the page this bh is mapped to */
253         void (*b_end_io)(struct buffer_head *bh, int uptodate); /* I/O completion */
254         void *b_private;                /* reserved for b_end_io */
255
256         unsigned long b_rsector;        /* Real buffer location on disk */
257         wait_queue_head_t b_wait;
258
259         struct inode *       b_inode;
260         struct list_head     b_inode_buffers;   /* doubly linked list of inode dirty buffers */
261 };
262
263 typedef void (bh_end_io_t)(struct buffer_head *bh, int uptodate);
264 void init_buffer(struct buffer_head *, bh_end_io_t *, void *);
265
266 #define __buffer_state(bh, state)       (((bh)->b_state & (1UL << BH_##state)) != 0)
267
268 #define buffer_uptodate(bh)     __buffer_state(bh,Uptodate)
269 #define buffer_dirty(bh)        __buffer_state(bh,Dirty)
270 #define buffer_locked(bh)       __buffer_state(bh,Lock)
271 #define buffer_req(bh)          __buffer_state(bh,Req)
272 #define buffer_mapped(bh)       __buffer_state(bh,Mapped)
273 #define buffer_new(bh)          __buffer_state(bh,New)
274 #define buffer_protected(bh)    __buffer_state(bh,Protected)
275
276 #define bh_offset(bh)           ((unsigned long)(bh)->b_data & ~PAGE_MASK)
277
278 extern void set_bh_page(struct buffer_head *bh, struct page *page, unsigned long offset);
279
280 #define touch_buffer(bh)        SetPageReferenced(bh->b_page)
281
282
283 #include <linux/pipe_fs_i.h>
284 #include <linux/minix_fs_i.h>
285 #include <linux/ext2_fs_i.h>
286 #include <linux/hpfs_fs_i.h>
287 #include <linux/ntfs_fs_i.h>
288 #include <linux/msdos_fs_i.h>
289 #include <linux/umsdos_fs_i.h>
290 #include <linux/iso_fs_i.h>
291 #include <linux/nfs_fs_i.h>
292 #include <linux/sysv_fs_i.h>
293 #include <linux/affs_fs_i.h>
294 #include <linux/ufs_fs_i.h>
295 #include <linux/efs_fs_i.h>
296 #include <linux/coda_fs_i.h>
297 #include <linux/romfs_fs_i.h>
298 #include <linux/shmem_fs.h>
299 #include <linux/smb_fs_i.h>
300 #include <linux/hfs_fs_i.h>
301 #include <linux/adfs_fs_i.h>
302 #include <linux/qnx4_fs_i.h>
303 #include <linux/reiserfs_fs_i.h>
304 #include <linux/bfs_fs_i.h>
305 #include <linux/udf_fs_i.h>
306 #include <linux/ncp_fs_i.h>
307 #include <linux/proc_fs_i.h>
308 #include <linux/usbdev_fs_i.h>
309 #include <linux/jffs2_fs_i.h>
310 #include <linux/cramfs_fs_sb.h>
311
312 /*
313  * Attribute flags.  These should be or-ed together to figure out what
314  * has been changed!
315  */
316 #define ATTR_MODE       1
317 #define ATTR_UID        2
318 #define ATTR_GID        4
319 #define ATTR_SIZE       8
320 #define ATTR_ATIME      16
321 #define ATTR_MTIME      32
322 #define ATTR_CTIME      64
323 #define ATTR_ATIME_SET  128
324 #define ATTR_MTIME_SET  256
325 #define ATTR_FORCE      512     /* Not a change, but a change it */
326 #define ATTR_ATTR_FLAG  1024
327
328 /*
329  * This is the Inode Attributes structure, used for notify_change().  It
330  * uses the above definitions as flags, to know which values have changed.
331  * Also, in this manner, a Filesystem can look at only the values it cares
332  * about.  Basically, these are the attributes that the VFS layer can
333  * request to change from the FS layer.
334  *
335  * Derek Atkins <warlord@MIT.EDU> 94-10-20
336  */
337 struct iattr {
338         unsigned int    ia_valid;
339         umode_t         ia_mode;
340         uid_t           ia_uid;
341         gid_t           ia_gid;
342         loff_t          ia_size;
343         time_t          ia_atime;
344         time_t          ia_mtime;
345         time_t          ia_ctime;
346         unsigned int    ia_attr_flags;
347 };
348
349 /*
350  * This is the inode attributes flag definitions
351  */
352 #define ATTR_FLAG_SYNCRONOUS    1       /* Syncronous write */
353 #define ATTR_FLAG_NOATIME       2       /* Don't update atime */
354 #define ATTR_FLAG_APPEND        4       /* Append-only file */
355 #define ATTR_FLAG_IMMUTABLE     8       /* Immutable file */
356 #define ATTR_FLAG_NODIRATIME    16      /* Don't update atime for directory */
357
358 /*
359  * Includes for diskquotas and mount structures.
360  */
361 #include <linux/quota.h>
362 #include <linux/mount.h>
363
364 /*
365  * oh the beauties of C type declarations.
366  */
367 struct page;
368 struct address_space;
369
370 struct address_space_operations {
371         int (*writepage)(struct page *);
372         int (*readpage)(struct file *, struct page *);
373         int (*sync_page)(struct page *);
374         int (*prepare_write)(struct file *, struct page *, unsigned, unsigned);
375         int (*commit_write)(struct file *, struct page *, unsigned, unsigned);
376         /* Unfortunately this kludge is needed for FIBMAP. Don't use it */
377         int (*bmap)(struct address_space *, long);
378 };
379
380 struct address_space {
381         struct list_head        clean_pages;    /* list of clean pages */
382         struct list_head        dirty_pages;    /* list of dirty pages */
383         struct list_head        locked_pages;   /* list of locked pages */
384         unsigned long           nrpages;        /* number of total pages */
385         struct address_space_operations *a_ops; /* methods */
386         struct inode            *host;          /* owner: inode, block_device */
387         struct vm_area_struct   *i_mmap;        /* list of private mappings */
388         struct vm_area_struct   *i_mmap_shared; /* list of shared mappings */
389         spinlock_t              i_shared_lock;  /* and spinlock protecting it */
390         int                     gfp_mask;       /* how to allocate the pages */
391 };
392
393 struct char_device {
394         struct list_head        hash;
395         atomic_t                count;
396         dev_t                   dev;
397         atomic_t                openers;
398         struct semaphore        sem;
399 };
400
401 struct block_device {
402         struct list_head        bd_hash;
403         atomic_t                bd_count;
404 /*      struct address_space    bd_data; */
405         dev_t                   bd_dev;  /* not a kdev_t - it's a search key */
406         atomic_t                bd_openers;
407         const struct block_device_operations *bd_op;
408         struct semaphore        bd_sem; /* open/close mutex */
409 };
410
411 struct inode {
412         struct list_head        i_hash;
413         struct list_head        i_list;
414         struct list_head        i_dentry;
415         
416         struct list_head        i_dirty_buffers;
417
418         unsigned long           i_ino;
419         atomic_t                i_count;
420         kdev_t                  i_dev;
421         umode_t                 i_mode;
422         nlink_t                 i_nlink;
423         uid_t                   i_uid;
424         gid_t                   i_gid;
425         kdev_t                  i_rdev;
426         loff_t                  i_size;
427         time_t                  i_atime;
428         time_t                  i_mtime;
429         time_t                  i_ctime;
430         unsigned long           i_blksize;
431         unsigned long           i_blocks;
432         unsigned long           i_version;
433         struct semaphore        i_sem;
434         struct semaphore        i_zombie;
435         struct inode_operations *i_op;
436         struct file_operations  *i_fop; /* former ->i_op->default_file_ops */
437         struct super_block      *i_sb;
438         wait_queue_head_t       i_wait;
439         struct file_lock        *i_flock;
440         struct address_space    *i_mapping;
441         struct address_space    i_data; 
442         struct dquot            *i_dquot[MAXQUOTAS];
443         /* These three should probably be a union */
444         struct pipe_inode_info  *i_pipe;
445         struct block_device     *i_bdev;
446         struct char_device      *i_cdev;
447
448         unsigned long           i_dnotify_mask; /* Directory notify events */
449         struct dnotify_struct   *i_dnotify; /* for directory notifications */
450
451         unsigned long           i_state;
452
453         unsigned int            i_flags;
454         unsigned char           i_sock;
455
456         atomic_t                i_writecount;
457         unsigned int            i_attr_flags;
458         __u32                   i_generation;
459         union {
460                 struct minix_inode_info         minix_i;
461                 struct ext2_inode_info          ext2_i;
462                 struct hpfs_inode_info          hpfs_i;
463                 struct ntfs_inode_info          ntfs_i;
464                 struct msdos_inode_info         msdos_i;
465                 struct umsdos_inode_info        umsdos_i;
466                 struct iso_inode_info           isofs_i;
467                 struct nfs_inode_info           nfs_i;
468                 struct sysv_inode_info          sysv_i;
469                 struct affs_inode_info          affs_i;
470                 struct ufs_inode_info           ufs_i;
471                 struct efs_inode_info           efs_i;
472                 struct romfs_inode_info         romfs_i;
473                 struct shmem_inode_info         shmem_i;
474                 struct coda_inode_info          coda_i;
475                 struct smb_inode_info           smbfs_i;
476                 struct hfs_inode_info           hfs_i;
477                 struct adfs_inode_info          adfs_i;
478                 struct qnx4_inode_info          qnx4_i;
479                 struct reiserfs_inode_info      reiserfs_i;
480                 struct bfs_inode_info           bfs_i;
481                 struct udf_inode_info           udf_i;
482                 struct ncp_inode_info           ncpfs_i;
483                 struct proc_inode_info          proc_i;
484                 struct socket                   socket_i;
485                 struct usbdev_inode_info        usbdev_i;
486                 struct jffs2_inode_info         jffs2_i;
487                 void                            *generic_ip;
488         } u;
489 };
490
491 struct fown_struct {
492         int pid;                /* pid or -pgrp where SIGIO should be sent */
493         uid_t uid, euid;        /* uid/euid of process setting the owner */
494         int signum;             /* posix.1b rt signal to be delivered on IO */
495 };
496
497 struct file {
498         struct list_head        f_list;
499         struct dentry           *f_dentry;
500         struct vfsmount         *f_vfsmnt;
501         struct file_operations  *f_op;
502         atomic_t                f_count;
503         unsigned int            f_flags;
504         mode_t                  f_mode;
505         loff_t                  f_pos;
506         unsigned long           f_reada, f_ramax, f_raend, f_ralen, f_rawin;
507         struct fown_struct      f_owner;
508         unsigned int            f_uid, f_gid;
509         int                     f_error;
510
511         unsigned long           f_version;
512
513         /* needed for tty driver, and maybe others */
514         void                    *private_data;
515 };
516 extern spinlock_t files_lock;
517 #define file_list_lock() spin_lock(&files_lock);
518 #define file_list_unlock() spin_unlock(&files_lock);
519
520 #define get_file(x)     atomic_inc(&(x)->f_count)
521 #define file_count(x)   atomic_read(&(x)->f_count)
522
523 extern int init_private_file(struct file *, struct dentry *, int);
524
525 #define MAX_NON_LFS     ((1UL<<31) - 1)
526
527 #define FL_POSIX        1
528 #define FL_FLOCK        2
529 #define FL_BROKEN       4       /* broken flock() emulation */
530 #define FL_ACCESS       8       /* for processes suspended by mandatory locking */
531 #define FL_LOCKD        16      /* lock held by rpc.lockd */
532 #define FL_LEASE        32      /* lease held on this file */
533
534 /*
535  * The POSIX file lock owner is determined by
536  * the "struct files_struct" in the thread group
537  * (or NULL for no owner - BSD locks).
538  *
539  * Lockd stuffs a "host" pointer into this.
540  */
541 typedef struct files_struct *fl_owner_t;
542
543 struct file_lock {
544         struct file_lock *fl_next;      /* singly linked list for this inode  */
545         struct list_head fl_link;       /* doubly linked list of all locks */
546         struct list_head fl_block;      /* circular list of blocked processes */
547         fl_owner_t fl_owner;
548         unsigned int fl_pid;
549         wait_queue_head_t fl_wait;
550         struct file *fl_file;
551         unsigned char fl_flags;
552         unsigned char fl_type;
553         loff_t fl_start;
554         loff_t fl_end;
555
556         void (*fl_notify)(struct file_lock *);  /* unblock callback */
557         void (*fl_insert)(struct file_lock *);  /* lock insertion callback */
558         void (*fl_remove)(struct file_lock *);  /* lock removal callback */
559
560         struct fasync_struct *  fl_fasync; /* for lease break notifications */
561
562         union {
563                 struct nfs_lock_info    nfs_fl;
564         } fl_u;
565 };
566
567 /* The following constant reflects the upper bound of the file/locking space */
568 #ifndef OFFSET_MAX
569 #define INT_LIMIT(x)    (~((x)1 << (sizeof(x)*8 - 1)))
570 #define OFFSET_MAX      INT_LIMIT(loff_t)
571 #define OFFT_OFFSET_MAX INT_LIMIT(off_t)
572 #endif
573
574 extern struct list_head file_lock_list;
575
576 #include <linux/fcntl.h>
577
578 extern int fcntl_getlk(unsigned int, struct flock *);
579 extern int fcntl_setlk(unsigned int, unsigned int, struct flock *);
580
581 extern int fcntl_getlk64(unsigned int, struct flock64 *);
582 extern int fcntl_setlk64(unsigned int, unsigned int, struct flock64 *);
583
584 /* fs/locks.c */
585 extern void locks_init_lock(struct file_lock *);
586 extern void locks_copy_lock(struct file_lock *, struct file_lock *);
587 extern void locks_remove_posix(struct file *, fl_owner_t);
588 extern void locks_remove_flock(struct file *);
589 extern struct file_lock *posix_test_lock(struct file *, struct file_lock *);
590 extern int posix_lock_file(struct file *, struct file_lock *, unsigned int);
591 extern void posix_block_lock(struct file_lock *, struct file_lock *);
592 extern void posix_unblock_lock(struct file_lock *);
593 extern int __get_lease(struct inode *inode, unsigned int flags);
594 extern time_t lease_get_mtime(struct inode *);
595 extern int lock_may_read(struct inode *, loff_t start, unsigned long count);
596 extern int lock_may_write(struct inode *, loff_t start, unsigned long count);
597
598 struct fasync_struct {
599         int     magic;
600         int     fa_fd;
601         struct  fasync_struct   *fa_next; /* singly linked list */
602         struct  file            *fa_file;
603 };
604
605 #define FASYNC_MAGIC 0x4601
606
607 /* SMP safe fasync helpers: */
608 extern int fasync_helper(int, struct file *, int, struct fasync_struct **);
609 /* can be called from interrupts */
610 extern void kill_fasync(struct fasync_struct **, int, int);
611 /* only for net: no internal synchronization */
612 extern void __kill_fasync(struct fasync_struct *, int, int);
613
614 struct nameidata {
615         struct dentry *dentry;
616         struct vfsmount *mnt;
617         struct qstr last;
618         unsigned int flags;
619         int last_type;
620 };
621
622 #define DQUOT_USR_ENABLED       0x01            /* User diskquotas enabled */
623 #define DQUOT_GRP_ENABLED       0x02            /* Group diskquotas enabled */
624
625 struct quota_mount_options
626 {
627         unsigned int flags;                     /* Flags for diskquotas on this device */
628         struct semaphore dqio_sem;              /* lock device while I/O in progress */
629         struct semaphore dqoff_sem;             /* serialize quota_off() and quota_on() on device */
630         struct file *files[MAXQUOTAS];          /* fp's to quotafiles */
631         time_t inode_expire[MAXQUOTAS];         /* expiretime for inode-quota */
632         time_t block_expire[MAXQUOTAS];         /* expiretime for block-quota */
633         char rsquash[MAXQUOTAS];                /* for quotas threat root as any other user */
634 };
635
636 /*
637  *      Umount options
638  */
639
640 #define MNT_FORCE       0x00000001      /* Attempt to forcibily umount */
641
642 #include <linux/minix_fs_sb.h>
643 #include <linux/ext2_fs_sb.h>
644 #include <linux/hpfs_fs_sb.h>
645 #include <linux/ntfs_fs_sb.h>
646 #include <linux/msdos_fs_sb.h>
647 #include <linux/iso_fs_sb.h>
648 #include <linux/nfs_fs_sb.h>
649 #include <linux/sysv_fs_sb.h>
650 #include <linux/affs_fs_sb.h>
651 #include <linux/ufs_fs_sb.h>
652 #include <linux/efs_fs_sb.h>
653 #include <linux/romfs_fs_sb.h>
654 #include <linux/smb_fs_sb.h>
655 #include <linux/hfs_fs_sb.h>
656 #include <linux/adfs_fs_sb.h>
657 #include <linux/qnx4_fs_sb.h>
658 #include <linux/reiserfs_fs_sb.h>
659 #include <linux/bfs_fs_sb.h>
660 #include <linux/udf_fs_sb.h>
661 #include <linux/ncp_fs_sb.h>
662 #include <linux/usbdev_fs_sb.h>
663 #include <linux/cramfs_fs_sb.h>
664 #include <linux/jffs2_fs_sb.h>
665
666 extern struct list_head super_blocks;
667 extern spinlock_t sb_lock;
668
669 #define sb_entry(list)  list_entry((list), struct super_block, s_list)
670 #define S_BIAS (1<<30)
671 struct super_block {
672         struct list_head        s_list;         /* Keep this first */
673         kdev_t                  s_dev;
674         unsigned long           s_blocksize;
675         unsigned char           s_blocksize_bits;
676         unsigned char           s_dirt;
677         unsigned long long      s_maxbytes;     /* Max file size */
678         struct file_system_type *s_type;
679         struct super_operations *s_op;
680         struct dquot_operations *dq_op;
681         unsigned long           s_flags;
682         unsigned long           s_magic;
683         struct dentry           *s_root;
684         struct rw_semaphore     s_umount;
685         struct semaphore        s_lock;
686         int                     s_count;
687         atomic_t                s_active;
688
689         struct list_head        s_dirty;        /* dirty inodes */
690         struct list_head        s_locked_inodes;/* inodes being synced */
691         struct list_head        s_files;
692
693         struct block_device     *s_bdev;
694         struct list_head        s_instances;
695         struct quota_mount_options s_dquot;     /* Diskquota specific options */
696
697         union {
698                 struct minix_sb_info    minix_sb;
699                 struct ext2_sb_info     ext2_sb;
700                 struct hpfs_sb_info     hpfs_sb;
701                 struct ntfs_sb_info     ntfs_sb;
702                 struct msdos_sb_info    msdos_sb;
703                 struct isofs_sb_info    isofs_sb;
704                 struct nfs_sb_info      nfs_sb;
705                 struct sysv_sb_info     sysv_sb;
706                 struct affs_sb_info     affs_sb;
707                 struct ufs_sb_info      ufs_sb;
708                 struct efs_sb_info      efs_sb;
709                 struct shmem_sb_info    shmem_sb;
710                 struct romfs_sb_info    romfs_sb;
711                 struct smb_sb_info      smbfs_sb;
712                 struct hfs_sb_info      hfs_sb;
713                 struct adfs_sb_info     adfs_sb;
714                 struct qnx4_sb_info     qnx4_sb;
715                 struct reiserfs_sb_info reiserfs_sb;
716                 struct bfs_sb_info      bfs_sb;
717                 struct udf_sb_info      udf_sb;
718                 struct ncp_sb_info      ncpfs_sb;
719                 struct usbdev_sb_info   usbdevfs_sb;
720                 struct jffs2_sb_info    jffs2_sb;
721                 struct cramfs_sb_info   cramfs_sb;
722                 void                    *generic_sbp;
723         } u;
724         /*
725          * The next field is for VFS *only*. No filesystems have any business
726          * even looking at it. You had been warned.
727          */
728         struct semaphore s_vfs_rename_sem;      /* Kludge */
729
730         /* The next field is used by knfsd when converting a (inode number based)
731          * file handle into a dentry. As it builds a path in the dcache tree from
732          * the bottom up, there may for a time be a subpath of dentrys which is not
733          * connected to the main tree.  This semaphore ensure that there is only ever
734          * one such free path per filesystem.  Note that unconnected files (or other
735          * non-directories) are allowed, but not unconnected diretories.
736          */
737         struct semaphore s_nfsd_free_path_sem;
738 };
739
740 /*
741  * VFS helper functions..
742  */
743 extern int vfs_create(struct inode *, struct dentry *, int);
744 extern int vfs_mkdir(struct inode *, struct dentry *, int);
745 extern int vfs_mknod(struct inode *, struct dentry *, int, dev_t);
746 extern int vfs_symlink(struct inode *, struct dentry *, const char *);
747 extern int vfs_link(struct dentry *, struct inode *, struct dentry *);
748 extern int vfs_rmdir(struct inode *, struct dentry *);
749 extern int vfs_unlink(struct inode *, struct dentry *);
750 extern int vfs_rename(struct inode *, struct dentry *, struct inode *, struct dentry *);
751
752 /*
753  * File types
754  */
755 #define DT_UNKNOWN      0
756 #define DT_FIFO         1
757 #define DT_CHR          2
758 #define DT_DIR          4
759 #define DT_BLK          6
760 #define DT_REG          8
761 #define DT_LNK          10
762 #define DT_SOCK         12
763 #define DT_WHT          14
764
765 /*
766  * This is the "filldir" function type, used by readdir() to let
767  * the kernel specify what kind of dirent layout it wants to have.
768  * This allows the kernel to read directories into kernel space or
769  * to have different dirent layouts depending on the binary type.
770  */
771 typedef int (*filldir_t)(void *, const char *, int, loff_t, ino_t, unsigned);
772
773 struct block_device_operations {
774         int (*open) (struct inode *, struct file *);
775         int (*release) (struct inode *, struct file *);
776         int (*ioctl) (struct inode *, struct file *, unsigned, unsigned long);
777         int (*check_media_change) (kdev_t);
778         int (*revalidate) (kdev_t);
779 };
780
781 /*
782  * NOTE:
783  * read, write, poll, fsync, readv, writev can be called
784  *   without the big kernel lock held in all filesystems.
785  */
786 struct file_operations {
787         struct module *owner;
788         loff_t (*llseek) (struct file *, loff_t, int);
789         ssize_t (*read) (struct file *, char *, size_t, loff_t *);
790         ssize_t (*write) (struct file *, const char *, size_t, loff_t *);
791         int (*readdir) (struct file *, void *, filldir_t);
792         unsigned int (*poll) (struct file *, struct poll_table_struct *);
793         int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
794         int (*mmap) (struct file *, struct vm_area_struct *);
795         int (*open) (struct inode *, struct file *);
796         int (*flush) (struct file *);
797         int (*release) (struct inode *, struct file *);
798         int (*fsync) (struct file *, struct dentry *, int datasync);
799         int (*fasync) (int, struct file *, int);
800         int (*lock) (struct file *, int, struct file_lock *);
801         ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *);
802         ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);
803         ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
804         unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
805 };
806
807 struct inode_operations {
808         int (*create) (struct inode *,struct dentry *,int);
809         struct dentry * (*lookup) (struct inode *,struct dentry *);
810         int (*link) (struct dentry *,struct inode *,struct dentry *);
811         int (*unlink) (struct inode *,struct dentry *);
812         int (*symlink) (struct inode *,struct dentry *,const char *);
813         int (*mkdir) (struct inode *,struct dentry *,int);
814         int (*rmdir) (struct inode *,struct dentry *);
815         int (*mknod) (struct inode *,struct dentry *,int,int);
816         int (*rename) (struct inode *, struct dentry *,
817                         struct inode *, struct dentry *);
818         int (*readlink) (struct dentry *, char *,int);
819         int (*follow_link) (struct dentry *, struct nameidata *);
820         void (*truncate) (struct inode *);
821         int (*permission) (struct inode *, int);
822         int (*revalidate) (struct dentry *);
823         int (*setattr) (struct dentry *, struct iattr *);
824         int (*getattr) (struct dentry *, struct iattr *);
825 };
826
827 /*
828  * NOTE: write_inode, delete_inode, clear_inode, put_inode can be called
829  * without the big kernel lock held in all filesystems.
830  */
831 struct super_operations {
832         void (*read_inode) (struct inode *);
833   
834         /* reiserfs kludge.  reiserfs needs 64 bits of information to
835         ** find an inode.  We are using the read_inode2 call to get
836         ** that information.  We don't like this, and are waiting on some
837         ** VFS changes for the real solution.
838         ** iget4 calls read_inode2, iff it is defined
839         */
840         void (*read_inode2) (struct inode *, void *) ;
841         void (*dirty_inode) (struct inode *);
842         void (*write_inode) (struct inode *, int);
843         void (*put_inode) (struct inode *);
844         void (*delete_inode) (struct inode *);
845         void (*put_super) (struct super_block *);
846         void (*write_super) (struct super_block *);
847         void (*write_super_lockfs) (struct super_block *);
848         void (*unlockfs) (struct super_block *);
849         int (*statfs) (struct super_block *, struct statfs *);
850         int (*remount_fs) (struct super_block *, int *, char *);
851         void (*clear_inode) (struct inode *);
852         void (*umount_begin) (struct super_block *);
853
854         /* Following are for knfsd to interact with "interesting" filesystems
855          * Currently just reiserfs, but possibly FAT and others later
856          *
857          * fh_to_dentry is given a filehandle fragement with length, and a type flag
858          *   and must return a dentry for the referenced object or, if "parent" is
859          *   set, a dentry for the parent of the object.
860          *   If a dentry cannot be found, a "root" dentry should be created and
861          *   flaged as DCACHE_NFSD_DISCONNECTED. nfsd_iget is an example implementation.
862          *
863          * dentry_to_fh is given a dentry and must generate the filesys specific
864          *   part of the file handle.  Available length is passed in *lenp and used
865          *   length should be returned therein.
866          *   If need_parent is set, then dentry_to_fh should encode sufficient information
867          *   to find the (current) parent.
868          *   dentry_to_fh should return a 1byte "type" which will be passed back in
869          *   the fhtype arguement to fh_to_dentry.  Type of 0 is reserved.
870          *   If filesystem was exportable before the introduction of fh_to_dentry,
871          *   types 1 and 2 should be used is that same way as the generic code.
872          *   Type 255 means error.
873          *
874          * Lengths are in units of 4bytes, not bytes.
875          */
876         struct dentry * (*fh_to_dentry)(struct super_block *sb, __u32 *fh, int len, int fhtype, int parent);
877         int (*dentry_to_fh)(struct dentry *, __u32 *fh, int *lenp, int need_parent);
878 };
879
880 /* Inode state bits.. */
881 #define I_DIRTY_SYNC            1 /* Not dirty enough for O_DATASYNC */
882 #define I_DIRTY_DATASYNC        2 /* Data-related inode changes pending */
883 #define I_DIRTY_PAGES           4 /* Data-related inode changes pending */
884 #define I_LOCK                  8
885 #define I_FREEING               16
886 #define I_CLEAR                 32
887
888 #define I_DIRTY (I_DIRTY_SYNC | I_DIRTY_DATASYNC | I_DIRTY_PAGES)
889
890 extern void __mark_inode_dirty(struct inode *, int);
891 static inline void mark_inode_dirty(struct inode *inode)
892 {
893         __mark_inode_dirty(inode, I_DIRTY);
894 }
895
896 static inline void mark_inode_dirty_sync(struct inode *inode)
897 {
898         __mark_inode_dirty(inode, I_DIRTY_SYNC);
899 }
900
901 static inline void mark_inode_dirty_pages(struct inode *inode)
902 {
903         __mark_inode_dirty(inode, I_DIRTY_PAGES);
904 }
905
906 struct dquot_operations {
907         void (*initialize) (struct inode *, short);
908         void (*drop) (struct inode *);
909         int (*alloc_block) (const struct inode *, unsigned long, char);
910         int (*alloc_inode) (const struct inode *, unsigned long);
911         void (*free_block) (const struct inode *, unsigned long);
912         void (*free_inode) (const struct inode *, unsigned long);
913         int (*transfer) (struct dentry *, struct iattr *);
914 };
915
916 struct file_system_type {
917         const char *name;
918         int fs_flags;
919         struct super_block *(*read_super) (struct super_block *, void *, int);
920         struct module *owner;
921         struct file_system_type * next;
922         struct list_head fs_supers;
923 };
924
925 #define DECLARE_FSTYPE(var,type,read,flags) \
926 struct file_system_type var = { \
927         name:           type, \
928         read_super:     read, \
929         fs_flags:       flags, \
930         owner:          THIS_MODULE, \
931 }
932
933 #define DECLARE_FSTYPE_DEV(var,type,read) \
934         DECLARE_FSTYPE(var,type,read,FS_REQUIRES_DEV)
935
936 /* Alas, no aliases. Too much hassle with bringing module.h everywhere */
937 #define fops_get(fops) \
938         (((fops) && (fops)->owner)      \
939                 ? ( try_inc_mod_count((fops)->owner) ? (fops) : NULL ) \
940                 : (fops))
941
942 #define fops_put(fops) \
943 do {    \
944         if ((fops) && (fops)->owner) \
945                 __MOD_DEC_USE_COUNT((fops)->owner);     \
946 } while(0)
947
948 extern int register_filesystem(struct file_system_type *);
949 extern int unregister_filesystem(struct file_system_type *);
950 extern struct vfsmount *kern_mount(struct file_system_type *);
951 extern int may_umount(struct vfsmount *);
952 extern long do_mount(char *, char *, char *, unsigned long, void *);
953
954 #define kern_umount mntput
955
956 extern int vfs_statfs(struct super_block *, struct statfs *);
957
958 /* Return value for VFS lock functions - tells locks.c to lock conventionally
959  * REALLY kosha for root NFS and nfs_lock
960  */ 
961 #define LOCK_USE_CLNT 1
962
963 #define FLOCK_VERIFY_READ  1
964 #define FLOCK_VERIFY_WRITE 2
965
966 extern int locks_mandatory_locked(struct inode *);
967 extern int locks_mandatory_area(int, struct inode *, struct file *, loff_t, size_t);
968
969 /*
970  * Candidates for mandatory locking have the setgid bit set
971  * but no group execute bit -  an otherwise meaningless combination.
972  */
973 #define MANDATORY_LOCK(inode) \
974         (IS_MANDLOCK(inode) && ((inode)->i_mode & (S_ISGID | S_IXGRP)) == S_ISGID)
975
976 static inline int locks_verify_locked(struct inode *inode)
977 {
978         if (MANDATORY_LOCK(inode))
979                 return locks_mandatory_locked(inode);
980         return 0;
981 }
982
983 static inline int locks_verify_area(int read_write, struct inode *inode,
984                                     struct file *filp, loff_t offset,
985                                     size_t count)
986 {
987         if (inode->i_flock && MANDATORY_LOCK(inode))
988                 return locks_mandatory_area(read_write, inode, filp, offset, count);
989         return 0;
990 }
991
992 static inline int locks_verify_truncate(struct inode *inode,
993                                     struct file *filp,
994                                     loff_t size)
995 {
996         if (inode->i_flock && MANDATORY_LOCK(inode))
997                 return locks_mandatory_area(
998                         FLOCK_VERIFY_WRITE, inode, filp,
999                         size < inode->i_size ? size : inode->i_size,
1000                         (size < inode->i_size ? inode->i_size - size
1001                          : size - inode->i_size)
1002                 );
1003         return 0;
1004 }
1005
1006 static inline int get_lease(struct inode *inode, unsigned int mode)
1007 {
1008         if (inode->i_flock && (inode->i_flock->fl_flags & FL_LEASE))
1009                 return __get_lease(inode, mode);
1010         return 0;
1011 }
1012
1013 /* fs/open.c */
1014
1015 asmlinkage long sys_open(const char *, int, int);
1016 asmlinkage long sys_close(unsigned int);        /* yes, it's really unsigned */
1017 extern int do_truncate(struct dentry *, loff_t start);
1018
1019 extern struct file *filp_open(const char *, int, int);
1020 extern struct file * dentry_open(struct dentry *, struct vfsmount *, int);
1021 extern int filp_close(struct file *, fl_owner_t id);
1022 extern char * getname(const char *);
1023
1024 /* fs/dcache.c */
1025 extern void vfs_caches_init(unsigned long);
1026
1027 #define __getname()     kmem_cache_alloc(names_cachep, SLAB_KERNEL)
1028 #define putname(name)   kmem_cache_free(names_cachep, (void *)(name))
1029
1030 enum {BDEV_FILE, BDEV_SWAP, BDEV_FS, BDEV_RAW};
1031 extern int register_blkdev(unsigned int, const char *, struct block_device_operations *);
1032 extern int unregister_blkdev(unsigned int, const char *);
1033 extern struct block_device *bdget(dev_t);
1034 extern void bdput(struct block_device *);
1035 extern struct char_device *cdget(dev_t);
1036 extern void cdput(struct char_device *);
1037 extern int blkdev_open(struct inode *, struct file *);
1038 extern struct file_operations def_blk_fops;
1039 extern struct file_operations def_fifo_fops;
1040 extern int ioctl_by_bdev(struct block_device *, unsigned, unsigned long);
1041 extern int blkdev_get(struct block_device *, mode_t, unsigned, int);
1042 extern int blkdev_put(struct block_device *, int);
1043
1044 /* fs/devices.c */
1045 extern const struct block_device_operations *get_blkfops(unsigned int);
1046 extern int register_chrdev(unsigned int, const char *, struct file_operations *);
1047 extern int unregister_chrdev(unsigned int, const char *);
1048 extern int chrdev_open(struct inode *, struct file *);
1049 extern const char * bdevname(kdev_t);
1050 extern const char * cdevname(kdev_t);
1051 extern const char * kdevname(kdev_t);
1052 extern void init_special_inode(struct inode *, umode_t, int);
1053
1054 /* Invalid inode operations -- fs/bad_inode.c */
1055 extern void make_bad_inode(struct inode *);
1056 extern int is_bad_inode(struct inode *);
1057
1058 extern struct file_operations read_fifo_fops;
1059 extern struct file_operations write_fifo_fops;
1060 extern struct file_operations rdwr_fifo_fops;
1061 extern struct file_operations read_pipe_fops;
1062 extern struct file_operations write_pipe_fops;
1063 extern struct file_operations rdwr_pipe_fops;
1064
1065 extern int fs_may_remount_ro(struct super_block *);
1066
1067 extern int try_to_free_buffers(struct page *, unsigned int);
1068 extern void refile_buffer(struct buffer_head * buf);
1069 extern void end_buffer_io_sync(struct buffer_head *bh, int uptodate);
1070
1071 /* reiserfs_writepage needs this */
1072 extern void set_buffer_async_io(struct buffer_head *bh) ;
1073
1074 #define BUF_CLEAN       0
1075 #define BUF_LOCKED      1       /* Buffers scheduled for write */
1076 #define BUF_DIRTY       2       /* Dirty buffers, not yet scheduled for write */
1077 #define BUF_PROTECTED   3       /* Ramdisk persistent storage */
1078 #define NR_LIST         4
1079
1080 static inline void get_bh(struct buffer_head * bh)
1081 {
1082         atomic_inc(&(bh)->b_count);
1083 }
1084
1085 static inline void put_bh(struct buffer_head *bh)
1086 {
1087         smp_mb__before_atomic_dec();
1088         atomic_dec(&bh->b_count);
1089 }
1090
1091 /*
1092  * This is called by bh->b_end_io() handlers when I/O has completed.
1093  */
1094 static inline void mark_buffer_uptodate(struct buffer_head * bh, int on)
1095 {
1096         if (on)
1097                 set_bit(BH_Uptodate, &bh->b_state);
1098         else
1099                 clear_bit(BH_Uptodate, &bh->b_state);
1100 }
1101
1102 #define atomic_set_buffer_clean(bh) test_and_clear_bit(BH_Dirty, &(bh)->b_state)
1103
1104 static inline void __mark_buffer_clean(struct buffer_head *bh)
1105 {
1106         refile_buffer(bh);
1107 }
1108
1109 static inline void mark_buffer_clean(struct buffer_head * bh)
1110 {
1111         if (atomic_set_buffer_clean(bh))
1112                 __mark_buffer_clean(bh);
1113 }
1114
1115 #define atomic_set_buffer_protected(bh) test_and_set_bit(BH_Protected, &(bh)->b_state)
1116
1117 static inline void __mark_buffer_protected(struct buffer_head *bh)
1118 {
1119         refile_buffer(bh);
1120 }
1121
1122 static inline void mark_buffer_protected(struct buffer_head * bh)
1123 {
1124         if (!atomic_set_buffer_protected(bh))
1125                 __mark_buffer_protected(bh);
1126 }
1127
1128 extern void FASTCALL(__mark_buffer_dirty(struct buffer_head *bh));
1129 extern void FASTCALL(mark_buffer_dirty(struct buffer_head *bh));
1130
1131 #define atomic_set_buffer_dirty(bh) test_and_set_bit(BH_Dirty, &(bh)->b_state)
1132
1133 /*
1134  * If an error happens during the make_request, this function
1135  * has to be recalled. It marks the buffer as clean and not
1136  * uptodate, and it notifys the upper layer about the end
1137  * of the I/O.
1138  */
1139 static inline void buffer_IO_error(struct buffer_head * bh)
1140 {
1141         mark_buffer_clean(bh);
1142         /*
1143          * b_end_io has to clear the BH_Uptodate bitflag in the error case!
1144          */
1145         bh->b_end_io(bh, 0);
1146 }
1147
1148 extern void buffer_insert_inode_queue(struct buffer_head *, struct inode *);
1149 static inline void mark_buffer_dirty_inode(struct buffer_head *bh, struct inode *inode)
1150 {
1151         mark_buffer_dirty(bh);
1152         buffer_insert_inode_queue(bh, inode);
1153 }
1154
1155 extern void balance_dirty(void);
1156 extern int check_disk_change(kdev_t);
1157 extern int invalidate_inodes(struct super_block *);
1158 extern int invalidate_device(kdev_t, int);
1159 extern void invalidate_inode_pages(struct inode *);
1160 extern void invalidate_inode_buffers(struct inode *);
1161 #define invalidate_buffers(dev) __invalidate_buffers((dev), 0)
1162 #define destroy_buffers(dev)    __invalidate_buffers((dev), 1)
1163 extern void __invalidate_buffers(kdev_t dev, int);
1164 extern void sync_inodes(kdev_t);
1165 extern void sync_unlocked_inodes(void);
1166 extern void write_inode_now(struct inode *, int);
1167 extern void sync_dev(kdev_t);
1168 extern int fsync_dev(kdev_t);
1169 extern int fsync_super(struct super_block *);
1170 extern int fsync_no_super(kdev_t);
1171 extern void sync_inodes_sb(struct super_block *);
1172 extern int fsync_inode_buffers(struct inode *);
1173 extern int osync_inode_buffers(struct inode *);
1174 extern int inode_has_buffers(struct inode *);
1175 extern void filemap_fdatasync(struct address_space *);
1176 extern void filemap_fdatawait(struct address_space *);
1177 extern void sync_supers(kdev_t);
1178 extern int bmap(struct inode *, int);
1179 extern int notify_change(struct dentry *, struct iattr *);
1180 extern int permission(struct inode *, int);
1181 extern int vfs_permission(struct inode *, int);
1182 extern int get_write_access(struct inode *);
1183 extern int deny_write_access(struct file *);
1184 static inline void put_write_access(struct inode * inode)
1185 {
1186         atomic_dec(&inode->i_writecount);
1187 }
1188 static inline void allow_write_access(struct file *file)
1189 {
1190         if (file)
1191                 atomic_inc(&file->f_dentry->d_inode->i_writecount);
1192 }
1193 extern int do_pipe(int *);
1194
1195 extern int open_namei(const char *, int, int, struct nameidata *);
1196
1197 extern int kernel_read(struct file *, unsigned long, char *, unsigned long);
1198 extern struct file * open_exec(const char *);
1199  
1200 /* fs/dcache.c -- generic fs support functions */
1201 extern int is_subdir(struct dentry *, struct dentry *);
1202 extern ino_t find_inode_number(struct dentry *, struct qstr *);
1203
1204 /*
1205  * Kernel pointers have redundant information, so we can use a
1206  * scheme where we can return either an error code or a dentry
1207  * pointer with the same return value.
1208  *
1209  * This should be a per-architecture thing, to allow different
1210  * error and pointer decisions.
1211  */
1212 static inline void *ERR_PTR(long error)
1213 {
1214         return (void *) error;
1215 }
1216
1217 static inline long PTR_ERR(const void *ptr)
1218 {
1219         return (long) ptr;
1220 }
1221
1222 static inline long IS_ERR(const void *ptr)
1223 {
1224         return (unsigned long)ptr > (unsigned long)-1000L;
1225 }
1226
1227 /*
1228  * The bitmask for a lookup event:
1229  *  - follow links at the end
1230  *  - require a directory
1231  *  - ending slashes ok even for nonexistent files
1232  *  - internal "there are more path compnents" flag
1233  */
1234 #define LOOKUP_FOLLOW           (1)
1235 #define LOOKUP_DIRECTORY        (2)
1236 #define LOOKUP_CONTINUE         (4)
1237 #define LOOKUP_POSITIVE         (8)
1238 #define LOOKUP_PARENT           (16)
1239 #define LOOKUP_NOALT            (32)
1240 /*
1241  * Type of the last component on LOOKUP_PARENT
1242  */
1243 enum {LAST_NORM, LAST_ROOT, LAST_DOT, LAST_DOTDOT, LAST_BIND};
1244
1245 /*
1246  * "descriptor" for what we're up to with a read for sendfile().
1247  * This allows us to use the same read code yet
1248  * have multiple different users of the data that
1249  * we read from a file.
1250  *
1251  * The simplest case just copies the data to user
1252  * mode.
1253  */
1254 typedef struct {
1255         size_t written;
1256         size_t count;
1257         char * buf;
1258         int error;
1259 } read_descriptor_t;
1260
1261 typedef int (*read_actor_t)(read_descriptor_t *, struct page *, unsigned long, unsigned long);
1262
1263 /* needed for stackable file system support */
1264 extern loff_t default_llseek(struct file *file, loff_t offset, int origin);
1265
1266 extern int __user_walk(const char *, unsigned, struct nameidata *);
1267 extern int path_init(const char *, unsigned, struct nameidata *);
1268 extern int path_walk(const char *, struct nameidata *);
1269 extern void path_release(struct nameidata *);
1270 extern int follow_down(struct vfsmount **, struct dentry **);
1271 extern int follow_up(struct vfsmount **, struct dentry **);
1272 extern struct dentry * lookup_one_len(const char *, struct dentry *, int);
1273 extern struct dentry * lookup_hash(struct qstr *, struct dentry *);
1274 #define user_path_walk(name,nd)  __user_walk(name, LOOKUP_FOLLOW|LOOKUP_POSITIVE, nd)
1275 #define user_path_walk_link(name,nd) __user_walk(name, LOOKUP_POSITIVE, nd)
1276
1277 extern void iput(struct inode *);
1278 extern void force_delete(struct inode *);
1279 extern struct inode * igrab(struct inode *);
1280 extern ino_t iunique(struct super_block *, ino_t);
1281
1282 typedef int (*find_inode_t)(struct inode *, unsigned long, void *);
1283 extern struct inode * iget4(struct super_block *, unsigned long, find_inode_t, void *);
1284 static inline struct inode *iget(struct super_block *sb, unsigned long ino)
1285 {
1286         return iget4(sb, ino, NULL, NULL);
1287 }
1288
1289 extern void clear_inode(struct inode *);
1290 extern struct inode * get_empty_inode(void);
1291 static inline struct inode * new_inode(struct super_block *sb)
1292 {
1293         struct inode *inode = get_empty_inode();
1294         if (inode) {
1295                 inode->i_sb = sb;
1296                 inode->i_dev = sb->s_dev;
1297         }
1298         return inode;
1299 }
1300 extern void remove_suid(struct inode *inode);
1301
1302 extern void insert_inode_hash(struct inode *);
1303 extern void remove_inode_hash(struct inode *);
1304 extern struct file * get_empty_filp(void);
1305 extern void file_move(struct file *f, struct list_head *list);
1306 extern struct buffer_head * get_hash_table(kdev_t, int, int);
1307 extern struct buffer_head * getblk(kdev_t, int, int);
1308 extern void ll_rw_block(int, int, struct buffer_head * bh[]);
1309 extern void submit_bh(int, struct buffer_head *);
1310 extern int is_read_only(kdev_t);
1311 extern void __brelse(struct buffer_head *);
1312 static inline void brelse(struct buffer_head *buf)
1313 {
1314         if (buf)
1315                 __brelse(buf);
1316 }
1317 extern void __bforget(struct buffer_head *);
1318 static inline void bforget(struct buffer_head *buf)
1319 {
1320         if (buf)
1321                 __bforget(buf);
1322 }
1323 extern void set_blocksize(kdev_t, int);
1324 extern struct buffer_head * bread(kdev_t, int, int);
1325 extern void wakeup_bdflush(void);
1326
1327 extern int brw_page(int, struct page *, kdev_t, int [], int);
1328
1329 typedef int (get_block_t)(struct inode*,long,struct buffer_head*,int);
1330
1331 /* Generic buffer handling for block filesystems.. */
1332 extern int block_flushpage(struct page *, unsigned long);
1333 extern int block_symlink(struct inode *, const char *, int);
1334 extern int block_write_full_page(struct page*, get_block_t*);
1335 extern int block_read_full_page(struct page*, get_block_t*);
1336 extern int block_prepare_write(struct page*, unsigned, unsigned, get_block_t*);
1337 extern int cont_prepare_write(struct page*, unsigned, unsigned, get_block_t*,
1338                                 unsigned long *);
1339 extern int block_sync_page(struct page *);
1340
1341 int generic_block_bmap(struct address_space *, long, get_block_t *);
1342 int generic_commit_write(struct file *, struct page *, unsigned, unsigned);
1343 int block_truncate_page(struct address_space *, loff_t, get_block_t *);
1344
1345 extern int waitfor_one_page(struct page*);
1346 extern int generic_file_mmap(struct file *, struct vm_area_struct *);
1347 extern int file_read_actor(read_descriptor_t * desc, struct page *page, unsigned long offset, unsigned long size);
1348 extern ssize_t generic_file_read(struct file *, char *, size_t, loff_t *);
1349 extern ssize_t generic_file_write(struct file *, const char *, size_t, loff_t *);
1350 extern void do_generic_file_read(struct file *, loff_t *, read_descriptor_t *, read_actor_t);
1351 extern loff_t no_llseek(struct file *file, loff_t offset, int origin);
1352 extern loff_t generic_file_llseek(struct file *file, loff_t offset, int origin);
1353 extern ssize_t generic_read_dir(struct file *, char *, size_t, loff_t *);
1354 extern int generic_file_open(struct inode * inode, struct file * filp);
1355
1356 extern struct file_operations generic_ro_fops;
1357
1358 extern int vfs_readlink(struct dentry *, char *, int, const char *);
1359 extern int vfs_follow_link(struct nameidata *, const char *);
1360 extern int page_readlink(struct dentry *, char *, int);
1361 extern int page_follow_link(struct dentry *, struct nameidata *);
1362 extern struct inode_operations page_symlink_inode_operations;
1363
1364 extern int vfs_readdir(struct file *, filldir_t, void *);
1365 extern int dcache_readdir(struct file *, void *, filldir_t);
1366
1367 extern struct file_system_type *get_fs_type(const char *name);
1368 extern struct super_block *get_super(kdev_t);
1369 extern void drop_super(struct super_block *sb);
1370 static inline int is_mounted(kdev_t dev)
1371 {
1372         struct super_block *sb = get_super(dev);
1373         if (sb) {
1374                 drop_super(sb);
1375                 return 1;
1376         }
1377         return 0;
1378 }
1379 unsigned long generate_cluster(kdev_t, int b[], int);
1380 unsigned long generate_cluster_swab32(kdev_t, int b[], int);
1381 extern kdev_t ROOT_DEV;
1382 extern char root_device_name[];
1383
1384
1385 extern void show_buffers(void);
1386 extern void mount_root(void);
1387
1388 #ifdef CONFIG_BLK_DEV_INITRD
1389 extern kdev_t real_root_dev;
1390 extern int change_root(kdev_t, const char *);
1391 #endif
1392
1393 extern ssize_t char_read(struct file *, char *, size_t, loff_t *);
1394 extern ssize_t block_read(struct file *, char *, size_t, loff_t *);
1395 extern int read_ahead[];
1396
1397 extern ssize_t char_write(struct file *, const char *, size_t, loff_t *);
1398 extern ssize_t block_write(struct file *, const char *, size_t, loff_t *);
1399
1400 extern int file_fsync(struct file *, struct dentry *, int);
1401 extern int generic_buffer_fdatasync(struct inode *inode, unsigned long start_idx, unsigned long end_idx);
1402 extern int generic_osync_inode(struct inode *, int);
1403
1404 extern int inode_change_ok(struct inode *, struct iattr *);
1405 extern int inode_setattr(struct inode *, struct iattr *);
1406
1407 /*
1408  * Common dentry functions for inclusion in the VFS
1409  * or in other stackable file systems.  Some of these
1410  * functions were in linux/fs/ C (VFS) files.
1411  *
1412  */
1413
1414 /*
1415  * Locking the parent is needed to:
1416  *  - serialize directory operations
1417  *  - make sure the parent doesn't change from
1418  *    under us in the middle of an operation.
1419  *
1420  * NOTE! Right now we'd rather use a "struct inode"
1421  * for this, but as I expect things to move toward
1422  * using dentries instead for most things it is
1423  * probably better to start with the conceptually
1424  * better interface of relying on a path of dentries.
1425  */
1426 static inline struct dentry *lock_parent(struct dentry *dentry)
1427 {
1428         struct dentry *dir = dget(dentry->d_parent);
1429
1430         down(&dir->d_inode->i_sem);
1431         return dir;
1432 }
1433
1434 static inline struct dentry *get_parent(struct dentry *dentry)
1435 {
1436         return dget(dentry->d_parent);
1437 }
1438
1439 static inline void unlock_dir(struct dentry *dir)
1440 {
1441         up(&dir->d_inode->i_sem);
1442         dput(dir);
1443 }
1444
1445 /*
1446  * Whee.. Deadlock country. Happily there are only two VFS
1447  * operations that does this..
1448  */
1449 static inline void double_down(struct semaphore *s1, struct semaphore *s2)
1450 {
1451         if (s1 != s2) {
1452                 if ((unsigned long) s1 < (unsigned long) s2) {
1453                         struct semaphore *tmp = s2;
1454                         s2 = s1; s1 = tmp;
1455                 }
1456                 down(s1);
1457         }
1458         down(s2);
1459 }
1460
1461 /*
1462  * Ewwwwwwww... _triple_ lock. We are guaranteed that the 3rd argument is
1463  * not equal to 1st and not equal to 2nd - the first case (target is parent of
1464  * source) would be already caught, the second is plain impossible (target is
1465  * its own parent and that case would be caught even earlier). Very messy.
1466  * I _think_ that it works, but no warranties - please, look it through.
1467  * Pox on bloody lusers who mandated overwriting rename() for directories...
1468  */
1469
1470 static inline void triple_down(struct semaphore *s1,
1471                                struct semaphore *s2,
1472                                struct semaphore *s3)
1473 {
1474         if (s1 != s2) {
1475                 if ((unsigned long) s1 < (unsigned long) s2) {
1476                         if ((unsigned long) s1 < (unsigned long) s3) {
1477                                 struct semaphore *tmp = s3;
1478                                 s3 = s1; s1 = tmp;
1479                         }
1480                         if ((unsigned long) s1 < (unsigned long) s2) {
1481                                 struct semaphore *tmp = s2;
1482                                 s2 = s1; s1 = tmp;
1483                         }
1484                 } else {
1485                         if ((unsigned long) s1 < (unsigned long) s3) {
1486                                 struct semaphore *tmp = s3;
1487                                 s3 = s1; s1 = tmp;
1488                         }
1489                         if ((unsigned long) s2 < (unsigned long) s3) {
1490                                 struct semaphore *tmp = s3;
1491                                 s3 = s2; s2 = tmp;
1492                         }
1493                 }
1494                 down(s1);
1495         } else if ((unsigned long) s2 < (unsigned long) s3) {
1496                 struct semaphore *tmp = s3;
1497                 s3 = s2; s2 = tmp;
1498         }
1499         down(s2);
1500         down(s3);
1501 }
1502
1503 static inline void double_up(struct semaphore *s1, struct semaphore *s2)
1504 {
1505         up(s1);
1506         if (s1 != s2)
1507                 up(s2);
1508 }
1509
1510 static inline void triple_up(struct semaphore *s1,
1511                              struct semaphore *s2,
1512                              struct semaphore *s3)
1513 {
1514         up(s1);
1515         if (s1 != s2)
1516                 up(s2);
1517         up(s3);
1518 }
1519
1520 static inline void double_lock(struct dentry *d1, struct dentry *d2)
1521 {
1522         double_down(&d1->d_inode->i_sem, &d2->d_inode->i_sem);
1523 }
1524
1525 static inline void double_unlock(struct dentry *d1, struct dentry *d2)
1526 {
1527         double_up(&d1->d_inode->i_sem,&d2->d_inode->i_sem);
1528         dput(d1);
1529         dput(d2);
1530 }
1531
1532 #endif /* __KERNEL__ */
1533
1534 #endif /* _LINUX_FS_H */